linhai778 发表于 2022-5-22 11:41

python 抓到详情页链接怎么进到链接抓取数据呢?

如图抓到列表页的数据,书籍链接就是详情页的链接,怎么继续进去抓取呢?(小白一枚请大佬们不吝赐教)

linhai778 发表于 2022-5-22 13:29

琢磨出来了..但是出现部分乱码情况,是我没有转码吗?strr那一部分不是转码的吗?

MyModHeaven 发表于 2022-5-22 13:29

我理解的意思是,你想问怎么抓取每本书的内容:再用 requests.get('每本书的链接'),就和列表页一样。把所有书的链接放到一个列表里,for 循环遍历所有的书

linhai778 发表于 2022-5-22 13:33

MyModHeaven 发表于 2022-5-22 13:29
我理解的意思是,你想问怎么抓取每本书的内容:再用 requests.get('每本书的链接'),就和列表页一样。把所 ...

我想进去详情链接里面再次抓,现在已经弄好了,就是出现部分乱码情况,大佬您看楼上我回复的那条,是我没有转码吗?还是什么情况

xiadongming 发表于 2022-5-22 15:16

AnnieM 发表于 2022-5-22 15:54

本帖最后由 AnnieM 于 2022-5-22 15:56 编辑

乱码部分尝试下GBK或者unicode试试
得到的地址再进行请求 或者抓包分析下请求的api

xlqin 发表于 2022-5-23 20:29

res=requests.get(url=url,headers=headers)
res.encording='gbk'
page=entree.HTML(res.text)
页: [1]
查看完整版本: python 抓到详情页链接怎么进到链接抓取数据呢?