吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1805|回复: 2
收起左侧

[讨论] 如何使用爬虫工具或者插件爬取不同页面地址并保存到本地?

[复制链接]
BeautifulBoy 发表于 2019-11-18 21:47
请教,现在遇到一个问题。


我需要去爬这样一个网页的信息:
http://tools.lenovo.com.cn/searchTools/Images/detail/id/xxx.html

xxx-代表id号,想从0开始爬取,可以的话先爬取一个区间比如

0-200000
200000-400000

现在已知,有内容的网页会返回如下页面,
image.png
而没有内容的页面返回json字符串:
{"code":4006,"error":"\u672a\u627e\u5230\u76f8\u5173\u955c\u50cf"}

现阶段是要把有内容的网址返回并保存在本地,需求的逻辑应该是怎样实现的?求教!
image.png

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

wdxm2008 发表于 2019-11-19 09:02
用正则表达式获取爬取内容 如果匹配就跳过报错,else就保存吧
170417 发表于 2019-11-20 10:53
你既然能得到它的返回内容,那你判断一下不就好了吗,就像楼上说的一样,if和else
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-27 00:29

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表