Zero0 发表于 2018-7-24 11:37

Python爬虫 -- 爬取crx拓展

主要使用

requests 以及 lxml 库

requests 用来爬取页面信息

lxml负责解析网页



附上源代码

链接: https://pan.baidu.com/s/1fSr1JMDMSiE-MaCFylLnAA 密码: mc9d

Zero0 发表于 2018-7-24 12:07

bin2694760981 发表于 2018-7-24 11:52
学爬虫前提是不是要熟悉html?

简单了解一下就行,知道标签 id class 基本上就可以了

cxqdly 发表于 2019-3-7 21:00

@Zero0 楼主 源码链接和你爬出来的crx链接都挂了能否在分享一下谢谢

Zero0 发表于 2018-7-24 11:41

crx下载https://www.52pojie.cn/thread-771156-1-1.html

泽龛 发表于 2018-7-24 11:49

多谢源码

bin2694760981 发表于 2018-7-24 11:52

学爬虫前提是不是要熟悉html?

wyx123 发表于 2018-7-24 11:55


多谢分享

gg5201314 发表于 2018-7-24 11:59

多谢分享了-.-

Renyi 发表于 2018-7-24 12:16

mark一下

LSHHT 发表于 2018-7-24 12:23

插个眼,方便传送。

dengad 发表于 2018-7-24 14:57

能解析出哪些东西
页: [1] 2
查看完整版本: Python爬虫 -- 爬取crx拓展