头狼 发表于 2020-9-24 18:23

python爬虫萌新求解惑

第一次学习爬虫,粗略浏览了些文章,看了几集视频,好多都是beautifulsoup那种找CSS结构的,感觉beautifulsoup那种模式很low,这是误解吗还是我没真正了解这个方法?我个人理解爬虫应该是那种抓包分析js,然后模拟操作什么的,beautifulsoup有这种方法吗?或者有别的库就是抓包玩法?python萌新求解

Menguy 发表于 2020-9-24 18:47

枫子树 发表于 2020-9-24 19:05

漁滒 发表于 2020-9-24 19:13

先学好基础,会用正则,xpath,beautifulsoup去处理html,xml,json的数据。然后再去学习css反爬,js反爬等

追梦的人 发表于 2020-9-24 19:17

没有什么low不low的只要能爬到想要的资源就行,过程不重要

kun5815 发表于 2020-9-24 19:38

不都是看返回的数据是哪种,再用哪种方式吗?

风绕柳絮轻敲雪 发表于 2020-9-24 19:52

一个解析库而已,哪有什么low不low,该用的时候还不是要用.....

hellozl 发表于 2020-9-24 20:03

BeautifulSoup也就用来洗个数据,你想抓包分析接口,正好,可以拿今日校园试试。

xmy00000 发表于 2020-9-24 20:43

bs4就是垃圾效率太低了,xpath、parse不香吗。。你说的分析js已经算是进阶了。这个需要有一定js基础,如果玩的溜就更好,更精深就是浏览器环境和风控。我认识一个大佬,goole验证码全套、al自己补头就能过,tb轻轻松松

senooo 发表于 2020-9-24 21:12

慢慢来 ,开飞机也得先加油啊
页: [1] 2
查看完整版本: python爬虫萌新求解惑