绝版coco 发表于 2019-7-28 13:21

python 爬虫 text herf 获取求助

<p class="link_add">性别:女 | 年龄:33 | 学历:大专 | 意向地区:吴兴区</p>

这个怎么获取里面的 文字呀

绝版coco 发表于 2019-7-28 13:24

p/text() 是空
目前只会获取text(),这个知识点是要补什么内容呀。好笨感觉,不会融会贯通。
怎么获取:性别:女 | 年龄:33 | 学历:大专 | 意向地区:吴兴区这些值呢

乐于助人 发表于 2019-7-28 13:26

感觉你的xpath写的有问题你可以发一下爬取目标HTML的那一段div什么的,不然看不出来你xpath的问题啊

绝版coco 发表于 2019-7-28 13:30

图片这里

绝版coco 发表于 2019-7-28 13:30

乐于助人 发表于 2019-7-28 13:26
感觉你的xpath写的有问题你可以发一下爬取目标HTML的那一段div什么的,不然看不出来你xpath的问题啊

图片楼下这样可以吗

乐于助人 发表于 2019-7-28 13:41

//div[@class="link_add"]/p/text()    这样写试试

奔跑的小牛 发表于 2019-7-28 14:25

datas.xpath("//div[@class='search_content']//p[@class='link_add']/text()").get()
其实我感觉这个页面应该只有一个link_add属性,那么其实可以简化成这样
datas.xpath("//p[@class='link_add']/text()").get()

bluerabbit 发表于 2019-7-28 14:49

xpath里直接这样写就行了 //p[@class="link_add"]/text()

bosseing 发表于 2019-7-28 14:51

如果link_add唯一的话可以用它来定位。1,2,3这样的能少用就少用。
from lxml import etree
datas = etree.HTML('<p class="link_add">性别:女 | 年龄:33 | 学历:大专 | 意向地区:吴兴区</p>')
res = datas.xpath('//p[@class="link_add"]/text()')
print(res)

绝版coco 发表于 2019-7-28 21:19

bosseing 发表于 2019-7-28 14:51
如果link_add唯一的话可以用它来定位。1,2,3这样的能少用就少用。
from lxml...

但是我想要获取link id 里面的有效值呀
页: [1] 2
查看完整版本: python 爬虫 text herf 获取求助