吧唧小脆脆 发表于 2020-1-8 21:19

爬虫xpath语法求助!

author = info.xpath('//div[@class="meta"]/a/text()')[0]
我就想问问那个啥子意思哦,换成为啥就不行了喔有大佬解答不

namedlxd 发表于 2020-1-8 21:30

是取一个列表里面的第1个元素, 如果列表长度是1的话,就会超出列表长度

Fris 发表于 2020-1-8 21:31

长度为1的数组

xiaotwins 发表于 2020-1-8 21:38

xpan提取出来的信息是以列表的形式表现出来的 指的是列表中的第一个

吧唧小脆脆 发表于 2020-1-8 21:40

懂了懂了,谢谢各位大佬解答

吧唧小脆脆 发表于 2020-1-8 22:16

xiaotwins 发表于 2020-1-8 21:38
xpan提取出来的信息是以列表的形式表现出来的 指的是列表中的第一个

请问我什么时候是要用上的呢,我应该如何判断是用还是呢

xiaotwins 发表于 2020-1-8 22:26

吧唧小脆脆 发表于 2020-1-8 22:16
请问我什么时候是要用上的呢,我应该如何判断是用还是呢

是提取列表第2个 是提取列表第3个以此类推 看你是要提取第几个 还是全提取
全提取就不用加

zhangtaishan1 发表于 2020-1-9 13:31

python的列表切片,xpath得到的是列表形式

人生苦短丶 发表于 2020-1-10 12:20

也不是指你xpath所得的全部是列表,就像你这个表达式 ,得到的是所有class=meta的div下的a的文本,在源代码中,这个div下的a标签有很多,,所以它返回的是所有的文本,是一个列表形式,要取列表的第几个元素,就在后面加个【n】,n代表元素的index,从0开始比如【x,c,v,b,n,m】中要想取出x   就在列表后加【0】,取出m就在后面加【5】

吧唧小脆脆 发表于 2020-1-10 20:23

人生苦短丶 发表于 2020-1-10 12:20
也不是指你xpath所得的全部是列表,就像你这个表达式 ,得到的是所有class=meta的div下的a的文本,在源代 ...

那我怎么得知返回的文本列表里面有几个元素呢
页: [1] 2
查看完整版本: 爬虫xpath语法求助!