python 爬虫 text herf 获取求助

绝版coco 发表于 2019-7-28 13:21

<p class="link_add">性别：女 | 年龄：33 | 学历：大专 | 意向地区：吴兴区</p>

这个怎么获取里面的文字呀

绝版coco 发表于 2019-7-28 13:24

p/text（）是空
目前只会获取text（），这个知识点是要补什么内容呀。好笨感觉，不会融会贯通。
怎么获取：性别：女 | 年龄：33 | 学历：大专 | 意向地区：吴兴区这些值呢

乐于助人 发表于 2019-7-28 13:26

感觉你的xpath写的有问题你可以发一下爬取目标HTML的那一段div什么的，不然看不出来你xpath的问题啊

绝版coco 发表于 2019-7-28 13:30

图片这里

绝版coco 发表于 2019-7-28 13:30

乐于助人发表于 2019-7-28 13:26
感觉你的xpath写的有问题你可以发一下爬取目标HTML的那一段div什么的，不然看不出来你xpath的问题啊

图片楼下这样可以吗

乐于助人 发表于 2019-7-28 13:41

//div[@class="link_add"]/p/text() 这样写试试

奔跑的小牛 发表于 2019-7-28 14:25

datas.xpath("//div[@class='search_content']//p[@class='link_add']/text()").get()
其实我感觉这个页面应该只有一个link_add属性，那么其实可以简化成这样
datas.xpath("//p[@class='link_add']/text()").get()

bluerabbit 发表于 2019-7-28 14:49

xpath里直接这样写就行了 //p[@class="link_add"]/text()

bosseing 发表于 2019-7-28 14:51

如果link_add唯一的话可以用它来定位。1，2，3这样的能少用就少用。
from lxml import etree
datas = etree.HTML('<p class="link_add">性别：女 | 年龄：33 | 学历：大专 | 意向地区：吴兴区</p>')
res = datas.xpath('//p[@class="link_add"]/text()')
print(res)

绝版coco 发表于 2019-7-28 21:19

bosseing 发表于 2019-7-28 14:51
如果link_add唯一的话可以用它来定位。1，2，3这样的能少用就少用。
from lxml...

但是我想要获取link id 里面的有效值呀

页: [1] 2

吾爱破解 - 52pojie.cn's Archiver

python 爬虫 text herf 获取求助