python爬虫萌新求解惑
第一次学习爬虫,粗略浏览了些文章,看了几集视频,好多都是beautifulsoup那种找CSS结构的,感觉beautifulsoup那种模式很low,这是误解吗还是我没真正了解这个方法?我个人理解爬虫应该是那种抓包分析js,然后模拟操作什么的,beautifulsoup有这种方法吗?或者有别的库就是抓包玩法?python萌新求解 先学好基础,会用正则,xpath,beautifulsoup去处理html,xml,json的数据。然后再去学习css反爬,js反爬等 没有什么low不low的只要能爬到想要的资源就行,过程不重要 不都是看返回的数据是哪种,再用哪种方式吗? 一个解析库而已,哪有什么low不low,该用的时候还不是要用..... BeautifulSoup也就用来洗个数据,你想抓包分析接口,正好,可以拿今日校园试试。 bs4就是垃圾效率太低了,xpath、parse不香吗。。你说的分析js已经算是进阶了。这个需要有一定js基础,如果玩的溜就更好,更精深就是浏览器环境和风控。我认识一个大佬,goole验证码全套、al自己补头就能过,tb轻轻松松 慢慢来 ,开飞机也得先加油啊
页:
[1]
2