爬虫xpath语法求助！

吧唧小脆脆 发表于 2020-1-8 21:19

author = info.xpath('//div[@class="meta"]/a/text()')[0]
我就想问问那个啥子意思哦，换成为啥就不行了喔有大佬解答不

namedlxd 发表于 2020-1-8 21:30

是取一个列表里面的第1个元素，如果列表长度是1的话，就会超出列表长度

Fris 发表于 2020-1-8 21:31

长度为1的数组

xiaotwins 发表于 2020-1-8 21:38

xpan提取出来的信息是以列表的形式表现出来的指的是列表中的第一个

吧唧小脆脆 发表于 2020-1-8 21:40

懂了懂了，谢谢各位大佬解答

吧唧小脆脆 发表于 2020-1-8 22:16

xiaotwins 发表于 2020-1-8 21:38
xpan提取出来的信息是以列表的形式表现出来的指的是列表中的第一个

请问我什么时候是要用上的呢，我应该如何判断是用还是呢

xiaotwins 发表于 2020-1-8 22:26

吧唧小脆脆发表于 2020-1-8 22:16
请问我什么时候是要用上的呢，我应该如何判断是用还是呢

是提取列表第2个是提取列表第3个以此类推看你是要提取第几个还是全提取
全提取就不用加

zhangtaishan1 发表于 2020-1-9 13:31

python的列表切片,xpath得到的是列表形式

人生苦短丶 发表于 2020-1-10 12:20

也不是指你xpath所得的全部是列表，就像你这个表达式，得到的是所有class=meta的div下的a的文本，在源代码中，这个div下的a标签有很多，，所以它返回的是所有的文本，是一个列表形式，要取列表的第几个元素，就在后面加个【n】，n代表元素的index，从0开始比如【x,c,v,b,n,m】中要想取出x 就在列表后加【0】，取出m就在后面加【5】

吧唧小脆脆 发表于 2020-1-10 20:23

人生苦短丶发表于 2020-1-10 12:20
也不是指你xpath所得的全部是列表，就像你这个表达式，得到的是所有class=meta的div下的a的文本，在源代 ...

那我怎么得知返回的文本列表里面有几个元素呢

页: [1] 2

吾爱破解 - 52pojie.cn's Archiver

爬虫xpath语法求助！