python 抓到详情页链接怎么进到链接抓取数据呢？

linhai778 发表于 2022-5-22 11:41

如图抓到列表页的数据，书籍链接就是详情页的链接，怎么继续进去抓取呢？（小白一枚请大佬们不吝赐教）

linhai778 发表于 2022-5-22 13:29

琢磨出来了..但是出现部分乱码情况，是我没有转码吗？strr那一部分不是转码的吗？

MyModHeaven 发表于 2022-5-22 13:29

我理解的意思是，你想问怎么抓取每本书的内容：再用 requests.get('每本书的链接')，就和列表页一样。把所有书的链接放到一个列表里，for 循环遍历所有的书

linhai778 发表于 2022-5-22 13:33

MyModHeaven 发表于 2022-5-22 13:29
我理解的意思是，你想问怎么抓取每本书的内容：再用 requests.get('每本书的链接')，就和列表页一样。把所 ...

我想进去详情链接里面再次抓，现在已经弄好了，就是出现部分乱码情况，大佬您看楼上我回复的那条，是我没有转码吗？还是什么情况

xiadongming 发表于 2022-5-22 15:16

AnnieM 发表于 2022-5-22 15:54

本帖最后由 AnnieM 于 2022-5-22 15:56 编辑

乱码部分尝试下GBK或者unicode试试
得到的地址再进行请求或者抓包分析下请求的api

xlqin 发表于 2022-5-23 20:29

res=requests.get(url=url,headers=headers)
res.encording='gbk'
page=entree.HTML(res.text)

页: [1]

吾爱破解 - 52pojie.cn's Archiver

python 抓到详情页链接怎么进到链接抓取数据呢？