Python爬虫 - 爬取crx拓展 - 吾爱破解 - 52pojie.cn

Zero0 发表于 2018-7-24 11:37

主要使用

requests 以及 lxml 库

requests 用来爬取页面信息

lxml负责解析网页

附上源代码

链接: https://pan.baidu.com/s/1fSr1JMDMSiE-MaCFylLnAA 密码: mc9d

Zero0 发表于 2018-7-24 12:07

bin2694760981 发表于 2018-7-24 11:52
学爬虫前提是不是要熟悉html?

简单了解一下就行，知道标签 id class 基本上就可以了

cxqdly 发表于 2019-3-7 21:00

@Zero0 楼主源码链接和你爬出来的crx链接都挂了能否在分享一下谢谢

Zero0 发表于 2018-7-24 11:41

crx下载https://www.52pojie.cn/thread-771156-1-1.html

泽龛发表于 2018-7-24 11:49

多谢源码

bin2694760981 发表于 2018-7-24 11:52

学爬虫前提是不是要熟悉html?

wyx123 发表于 2018-7-24 11:55

多谢分享

gg5201314 发表于 2018-7-24 11:59

多谢分享了-.-

Renyi 发表于 2018-7-24 12:16

mark一下

LSHHT 发表于 2018-7-24 12:23

插个眼，方便传送。

dengad 发表于 2018-7-24 14:57

能解析出哪些东西

页: [1] 2

吾爱破解 - 52pojie.cn's Archiver