官方bilibili Windows破解入门 Android逆向入门

【网络诊断修复工具】切换到窄版

ganzhuweixin

吾爱破解 - 52pojie.cn»网站 › 【软件安全】 › 『编程语言区』 › 『编程语言讨论求助区』 › 如何使用爬虫工具或者插件爬取不同页面地址并保存到本地 ...

发新帖

查看: 1841|回复: 2

收起左侧

[讨论] 如何使用爬虫工具或者插件爬取不同页面地址并保存到本地？

BeautifulBoy 发表于 2019-11-18 21:47

请教，现在遇到一个问题。

我需要去爬这样一个网页的信息：
http://tools.lenovo.com.cn/searchTools/Images/detail/id/xxx.html

xxx-代表id号，想从0开始爬取，可以的话先爬取一个区间比如

0-200000
200000-400000

现在已知，有内容的网页会返回如下页面，

而没有内容的页面返回json字符串：
{"code":4006,"error":"\u672a\u627e\u5230\u76f8\u5173\u955c\u50cf"}

现阶段是要把有内容的网址返回并保存在本地，需求的逻辑应该是怎样实现的？求教！

发帖前要善用【论坛搜索】功能，那里可能会有你要找的答案或者已经有人发布过相同内容了，请勿重复发帖。

回复

wdxm2008 发表于 2019-11-19 09:02

用正则表达式获取爬取内容如果匹配就跳过报错，else就保存吧

【吾爱破解论坛总版规】 - [让你充分了解吾爱破解论坛行为规则]

回复支持

170417 发表于 2019-11-20 10:53

吾爱破解论坛没有任何官方QQ群，禁止留联系方式，禁止任何商业交易。

你既然能得到它的返回内容，那你判断一下不就好了吗，就像楼上说的一样，if和else

如何升级？如何获得积分？积分对应解释说明！

回复支持

发新帖

免责声明：
吾爱破解所发布的一切破解补丁、注册机和注册信息及软件的解密分析文章仅限用于学习和研究目的；不得将上述内容用于商业或者非法用途，否则，一切后果请用户自负。本站信息来自网络，版权争议与本站无关。您必须在下载后的24个小时之内，从您的电脑中彻底删除上述内容。如果您喜欢该程序，请支持正版软件，购买注册，得到更好的正版服务。如有侵权请邮件与我们联系处理。

Mail To:Service@52pojie.cn

返回列表

关注微信

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2025-1-13 13:56

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表