吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 5379|回复: 15
收起左侧

[Python 转载] Python爬虫 -- 爬取crx拓展

[复制链接]
Zero0 发表于 2018-7-24 11:37
主要使用

requests 以及 lxml 库

requests 用来爬取页面信息

lxml负责解析网页

0_RU]M]6@YRZ]R)C3EY8QP2.png OCN)T@O7]G$Z{SPOP$}S2.png

附上源代码

链接: https://pan.baidu.com/s/1fSr1JMDMSiE-MaCFylLnAA 密码: mc9d

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| Zero0 发表于 2018-7-24 12:07
bin2694760981 发表于 2018-7-24 11:52
学爬虫前提是不是要熟悉html?

简单了解一下就行,知道标签 id class 基本上就可以了
cxqdly 发表于 2019-3-7 21:00
@Zero0 楼主 源码链接和你爬出来的crx链接都挂了  能否在分享一下  谢谢
 楼主| Zero0 发表于 2018-7-24 11:41
泽龛 发表于 2018-7-24 11:49
多谢源码
bin2694760981 发表于 2018-7-24 11:52
学爬虫前提是不是要熟悉html?
wyx123 发表于 2018-7-24 11:55

多谢分享
gg5201314 发表于 2018-7-24 11:59
多谢分享了  -.-
Renyi 发表于 2018-7-24 12:16
mark一下
LSHHT 发表于 2018-7-24 12:23
插个眼,方便传送。
dengad 发表于 2018-7-24 14:57
能解析出哪些东西
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-16 06:03

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表