吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1760|回复: 12
收起左侧

[求助] python 爬虫 text herf 获取求助

[复制链接]
绝版coco 发表于 2019-7-28 13:21
<p class="link_add">性别:女 | 年龄:33 | 学历:大专 | 意向地区:吴兴区</p>

这个怎么获取里面的 文字呀
image.png

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| 绝版coco 发表于 2019-7-28 13:24
p[1]/text() 是空
目前只会获取text(),这个知识点是要补什么内容呀。好笨感觉,不会融会贯通。
怎么获取:性别:女 | 年龄:33 | 学历:大专 | 意向地区:吴兴区这些值呢
乐于助人 发表于 2019-7-28 13:26
感觉你的xpath写的有问题  你可以发一下爬取目标HTML的那一段div什么的,不然看不出来你xpath的问题啊
 楼主| 绝版coco 发表于 2019-7-28 13:30
 楼主| 绝版coco 发表于 2019-7-28 13:30
乐于助人 发表于 2019-7-28 13:26
感觉你的xpath写的有问题  你可以发一下爬取目标HTML的那一段div什么的,不然看不出来你xpath的问题啊

图片楼下这样可以吗
乐于助人 发表于 2019-7-28 13:41
//div[@class="link_add"]/p/text()    这样写试试
奔跑的小牛 发表于 2019-7-28 14:25
datas.xpath("//div[@class='search_content']//p[@class='link_add']/text()").get()
其实我感觉这个页面应该只有一个link_add属性,那么其实可以简化成这样
datas.xpath("//p[@class='link_add']/text()").get()
bluerabbit 发表于 2019-7-28 14:49
xpath里直接这样写就行了 //p[@class="link_add"]/text()
bosseing 发表于 2019-7-28 14:51
如果link_add唯一的话可以用它来定位。1,2,3这样的能少用就少用。
[Python] 纯文本查看 复制代码
from lxml import etree
datas = etree.HTML('<p class="link_add">性别:女 | 年龄:33 | 学历:大专 | 意向地区:吴兴区</p>')
res = datas.xpath('//p[@class="link_add"]/text()')
print(res)
 楼主| 绝版coco 发表于 2019-7-28 21:19
bosseing 发表于 2019-7-28 14:51
如果link_add唯一的话可以用它来定位。1,2,3这样的能少用就少用。
[mw_shl_code=python,true]from lxml  ...

但是我想要获取link id 里面的有效值呀
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-27 02:40

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表