如何使用爬虫工具或者插件爬取不同页面地址并保存到本地？

网站 › 『编程语言讨论求助区』 › 如何使用爬虫工具或者插件爬取不同页面地址并保存到本地？

BeautifulBoy 发表于 2019-11-18 21:47

请教，现在遇到一个问题。
chrome-extension://fnjoonbenhhijnoegpfkpagjamomgjjm/static/sound.svg

我需要去爬这样一个网页的信息：
http://tools.lenovo.com.cn/searchTools/Images/detail/id/xxx.html

xxx-代表id号，想从0开始爬取，可以的话先爬取一个区间比如

0-200000
200000-400000

现在已知，有内容的网页会返回如下页面，

而没有内容的页面返回json字符串：
{"code":4006,"error":"\u672a\u627e\u5230\u76f8\u5173\u955c\u50cf"}

现阶段是要把有内容的网址返回并保存在本地，需求的逻辑应该是怎样实现的？求教！

wdxm2008 发表于 2019-11-19 09:02

用正则表达式获取爬取内容如果匹配就跳过报错，else就保存吧

170417 发表于 2019-11-20 10:53

你既然能得到它的返回内容，那你判断一下不就好了吗，就像楼上说的一样，if和else

页: [1]

免责声明：
吾爱破解所发布的一切破解补丁、注册机和注册信息及软件的解密分析文章仅限用于学习和研究目的；不得将上述内容用于商业或者非法用途，否则，一切后果请用户自负。本站信息来自网络，版权争议与本站无关。您必须在下载后的24个小时之内，从您的电脑中彻底删除上述内容。如果您喜欢该程序，请支持正版软件，购买注册，得到更好的正版服务。如有侵权请邮件与我们联系处理。

Mail To:Service@52pojie.cn

吾爱破解 - 52pojie.cn's Archiver

如何使用爬虫工具或者插件爬取不同页面地址并保存到本地？