python 爬虫 text herf 获取求助
<p class="link_add">性别:女 | 年龄:33 | 学历:大专 | 意向地区:吴兴区</p>这个怎么获取里面的 文字呀
p/text() 是空
目前只会获取text(),这个知识点是要补什么内容呀。好笨感觉,不会融会贯通。
怎么获取:性别:女 | 年龄:33 | 学历:大专 | 意向地区:吴兴区这些值呢 感觉你的xpath写的有问题你可以发一下爬取目标HTML的那一段div什么的,不然看不出来你xpath的问题啊
图片这里 乐于助人 发表于 2019-7-28 13:26
感觉你的xpath写的有问题你可以发一下爬取目标HTML的那一段div什么的,不然看不出来你xpath的问题啊
图片楼下这样可以吗
//div[@class="link_add"]/p/text() 这样写试试 datas.xpath("//div[@class='search_content']//p[@class='link_add']/text()").get()
其实我感觉这个页面应该只有一个link_add属性,那么其实可以简化成这样
datas.xpath("//p[@class='link_add']/text()").get() xpath里直接这样写就行了 //p[@class="link_add"]/text() 如果link_add唯一的话可以用它来定位。1,2,3这样的能少用就少用。
from lxml import etree
datas = etree.HTML('<p class="link_add">性别:女 | 年龄:33 | 学历:大专 | 意向地区:吴兴区</p>')
res = datas.xpath('//p[@class="link_add"]/text()')
print(res) bosseing 发表于 2019-7-28 14:51
如果link_add唯一的话可以用它来定位。1,2,3这样的能少用就少用。
from lxml...
但是我想要获取link id 里面的有效值呀
页:
[1]
2