python 抓到详情页链接怎么进到链接抓取数据呢？

linhai778 · 发表于 2022-5-22 11:41

如图抓到列表页的数据，书籍链接就是详情页的链接，怎么继续进去抓取呢？（小白一枚请大佬们不吝赐教）

linhai778 · 发表于 2022-5-22 13:29

琢磨出来了..但是出现部分乱码情况，是我没有转码吗？ strr那一部分不是转码的吗？

MyModHeaven · 发表于 2022-5-22 13:29

我理解的意思是，你想问怎么抓取每本书的内容：再用 requests.get('每本书的链接')，就和列表页一样。把所有书的链接放到一个列表里，for 循环遍历所有的书

linhai778 · 发表于 2022-5-22 13:33

MyModHeaven 发表于 2022-5-22 13:29
我理解的意思是，你想问怎么抓取每本书的内容：再用 requests.get('每本书的链接')，就和列表页一样。把所 ...

我想进去详情链接里面再次抓，现在已经弄好了，就是出现部分乱码情况，大佬您看楼上我回复的那条，是我没有转码吗？还是什么情况

xiadongming · 发表于 2022-5-22 15:16

提示: 作者被禁止或删除内容自动屏蔽

AnnieM · 发表于 2022-5-22 15:54

本帖最后由 AnnieM 于 2022-5-22 15:56 编辑

乱码部分尝试下GBK或者unicode试试
得到的地址再进行请求或者抓包分析下请求的api

xlqin · 发表于 2022-5-23 20:29

res=requests.get(url=url,headers=headers)
res.encording='gbk'
page=entree.HTML(res.text)

帐号		自动登录	找回密码
密码			注册[Register]

xiadongming xiadongming 当前离线好友阅读权限 0 听众最后登录 1970-1-1 头像被屏蔽	xiadongming 发表于 2022-5-22 15:16 提示: 作者被禁止或删除内容自动屏蔽
	如何快速判断一个文件是否为病毒！
	回复支持举报

[求助] python 抓到详情页链接怎么进到链接抓取数据呢？