全球主机交流论坛
标题:
有用神箭手的吗,问个正则问题?
[打印本页]
作者:
jshkk
时间:
2018-1-24 11:51
标题:
有用神箭手的吗,问个正则问题?
我想采集1-45页的内容,
helperUrlRegexes: ["http://***\/page\/^([1-9]|[1-3][0-9]|[4][0-5])$"], //列表页
这样子写似乎不对,在测试时直接提示“测试运行结束,爬虫自动停止,测试完毕!”,只跑了个示例的page=1
是这个正则有问题还是xpath的语法不对啊?求指导
作者:
jshkk
时间:
2018-1-24 12:08
来个大佬~~~
作者:
Carseason
时间:
2018-1-24 12:17
本帖最后由 Carseason 于 2018-1-24 12:19 编辑
http:\/\/[^"]+\/page\/[1-4]{0,1}[0-9]$
这样子试一试
作者:
jshkk
时间:
2018-1-24 12:48
Carseason 发表于 2018-1-24 12:17
http:\/\/[^"]+\/page\/[1-4]{0,1}[0-9]$
这样子试一试
多谢!
按照你的方式测试了下,果然OK..
只要不带^的起始符就好了
欢迎光临 全球主机交流论坛 (https://loc.1226.eu.org/)
Powered by Discuz! X3.4