吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1557|回复: 15
收起左侧

[求助] python爬虫萌新求解惑

[复制链接]
头狼 发表于 2020-9-24 18:23
第一次学习爬虫,粗略浏览了些文章,看了几集视频,好多都是beautifulsoup那种找CSS结构的,感觉beautifulsoup那种模式很low,这是误解吗还是我没真正了解这个方法?我个人理解爬虫应该是那种抓包分析js,然后模拟操作什么的,beautifulsoup有这种方法吗?或者有别的库就是抓包玩法?python萌新求解

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

头像被屏蔽
Menguy 发表于 2020-9-24 18:47
提示: 作者被禁止或删除 内容自动屏蔽
头像被屏蔽
枫子树 发表于 2020-9-24 19:05
漁滒 发表于 2020-9-24 19:13
先学好基础,会用正则,xpath,beautifulsoup去处理html,xml,json的数据。然后再去学习css反爬,js反爬等
追梦的人 发表于 2020-9-24 19:17
没有什么low不low的只要能爬到想要的资源就行,过程不重要
kun5815 发表于 2020-9-24 19:38
不都是看返回的数据是哪种,再用哪种方式吗?
风绕柳絮轻敲雪 发表于 2020-9-24 19:52
一个解析库而已,哪有什么low不low,该用的时候还不是要用.....
hellozl 发表于 2020-9-24 20:03
BeautifulSoup也就用来洗个数据,你想抓包分析接口,正好,可以拿今日校园试试。
xmy00000 发表于 2020-9-24 20:43
bs4就是垃圾效率太低了,xpath、parse不香吗。。你说的分析js已经算是进阶了。这个需要有一定js基础,如果玩的溜就更好,更精深就是浏览器环境和风控。我认识一个大佬,goole验证码全套、al自己补头就能过,tb轻轻松松
senooo 发表于 2020-9-24 21:12
慢慢来 ,开飞机也得先加油啊  
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-26 12:45

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表