double07 发表于 2021-4-11 23:39

淘宝搜索页面数据解析?

本帖最后由 double07 于 2021-4-11 23:41 编辑


解析内容正确,但无论怎样变更xpath地址,输出的结果始终为空,问题出在哪儿?

雪莱鸟 发表于 2021-4-11 23:51

将获取的html打印出来或者写入文件看看,查看一下是否有需要的内容

Goldrepo 发表于 2021-4-12 00:17

试试这样行不行
//*[@id="mainsrp-itemlist"]/div/div/div/div/text()

QuiryRain 发表于 2021-4-12 08:00

web版的数据好像在network->js列中,好好找找会有的

gentlespider 发表于 2021-4-12 08:31

首先要明确的一点是不论何种解析方式,都是基于本地字符串进行解析的,所以建议不要在Elements里面复制xpath语法,要看响应回来的字符串,这个才是你真正要解析的内容。
如果解析出来的没有数据,那就只有两种情况,第一种是路由找错了,里面根本没有你要的内容,第二种是xpath语法写错了,内容在里面但是标签信息你没对的上。

CaoDF 发表于 2021-4-12 08:45

你输出的是len,b的长度

xiaobailong 发表于 2021-4-12 09:27

浏览器定位elements 然后右健coyp->copy XPath

double07 发表于 2021-4-12 09:29

雪莱鸟 发表于 2021-4-11 23:51
将获取的html打印出来或者写入文件看看,查看一下是否有需要的内容

想要的内容都有,但无论怎样换xpath输出为【】

double07 发表于 2021-4-12 09:31

Goldrepo 发表于 2021-4-12 00:17
试试这样行不行
//*[@id="mainsrp-itemlist"]/div/div/div/div/text()

不行的,需求是列表,是不文本

qeq66 发表于 2021-4-12 10:05

这个页面是动态生成DOM,所以你Xpath根本找不到,建议你正则提取json数据,然后格式化去处理

g_page_config = {"pageName":"mainsrp","mods":{"shopcombotip":{"status":"hide"},"phonenav":{"status":"hide"},"debugbar":{"status":"hide"},"shopcombo":{"status":"hide"},"itemlist"
页: [1] 2
查看完整版本: 淘宝搜索页面数据解析?