python 抓到详情页链接怎么进到链接抓取数据呢?
如图抓到列表页的数据,书籍链接就是详情页的链接,怎么继续进去抓取呢?(小白一枚请大佬们不吝赐教) 琢磨出来了..但是出现部分乱码情况,是我没有转码吗?strr那一部分不是转码的吗? 我理解的意思是,你想问怎么抓取每本书的内容:再用 requests.get('每本书的链接'),就和列表页一样。把所有书的链接放到一个列表里,for 循环遍历所有的书 MyModHeaven 发表于 2022-5-22 13:29我理解的意思是,你想问怎么抓取每本书的内容:再用 requests.get('每本书的链接'),就和列表页一样。把所 ...
我想进去详情链接里面再次抓,现在已经弄好了,就是出现部分乱码情况,大佬您看楼上我回复的那条,是我没有转码吗?还是什么情况 本帖最后由 AnnieM 于 2022-5-22 15:56 编辑
乱码部分尝试下GBK或者unicode试试
得到的地址再进行请求 或者抓包分析下请求的api res=requests.get(url=url,headers=headers)
res.encording='gbk'
page=entree.HTML(res.text)
页:
[1]