「Scrapy——css选择器」使用时遇到问题

thepoy 发表于 2019-8-2 12:11

如图所示，下面这行代码获得结果为空，不知道问题出在哪里。
max_page = response.css('div#page-container::attr(data-pageMax)').extract()

ixsec 发表于 2019-8-2 12:51

把地址给出来？

feiyu361 发表于 2019-8-2 13:00

兄弟,你为什么不用xpath?

ixsec 发表于 2019-8-2 13:14

xpath 语法 '//*[@id="page-container"]/@data-pagemax'

thepoy 发表于 2019-8-2 14:44

feiyu361 发表于 2019-8-2 13:00
兄弟,你为什么不用xpath?

css速度快啊，语法也更简洁一点

thepoy 发表于 2019-8-2 14:46

ixsec 发表于 2019-8-2 12:51
把地址给出来？

起点中文网的月票排行
https://www.qidian.com/rank/yuepiao?chn=21&page=1

ixsec 发表于 2019-8-2 15:34

thepoy 发表于 2019-8-2 14:46
起点中文网的月票排行
https://www.qidian.com/rank/yuepiao?chn=21&page=1

可以获取到

response.css('#page-container::attr(data-pagemax)').extract()

这个获取就是5

ixsec 发表于 2019-8-2 15:35

你的翻页有问题，好好看看scrapy 的官方文档

ixsec 发表于 2019-8-2 15:42

看看结果~

真实有效

thepoy 发表于 2019-8-2 19:21

ixsec 发表于 2019-8-2 15:34
可以获取到

response.css('#page-container::attr(data-pagemax)').extract ...

我这里加上标签'div'后就获取不到了，不加才能获取到。

页: [1] 2

吾爱破解 - 52pojie.cn's Archiver

「Scrapy——css选择器」使用时遇到问题