plaodj 发表于 2022-5-21 10:49

求助python beautifulsoup4 的解析指定内容的写法

本帖最后由 plaodj 于 2022-5-21 13:16 编辑

使用python 解析 html 内容
搜索复制

采用的beautifulsoup4库 (如果您有更好的解析html库也更容易使用也请告知我,谢谢)

获取的html代码(节选):
<div class="input_name1">性别:</div>
                              <select name="SEX" class="term1_select">
                                                                              <option value="1">男</option>
                                        <option value="0" selected>女</option>
                                                                        </select>

假设我已经把html 赋给 bs

我现在想获取 select项里   value值   也就是 option里面 有被 添加selected 对应的value
print(bs.find('select', {'name':'SEX'}).find('option',{'selected'})['value'])

结果没达到目的
请帮忙解决一下 谢谢
搜索复制

tsu.xxw 发表于 2022-5-21 11:20

试试xpath

unmask 发表于 2022-5-21 11:24

bs.find('select', {'name':'SEX'}).find("option", {"selected":True})["value"]

XiaoZouYu 发表于 2022-5-21 11:51

用xpath转化一下

Harold123 发表于 2022-5-21 12:48

from lxml import etree
html = etree.HTML(html_text)
print(html.xpath("//select/option[@selected]/@value"))

plaodj 发表于 2022-5-21 13:15

unmask 发表于 2022-5-21 11:24
bs.find('select', {'name':'SEX'}).find("option", {"selected":True})["value" ...

你这个可行   谢谢

叫我小王叔叔 发表于 2022-5-21 15:03

我一般用parsel,但是你这问题,我也不会,一起学习。
页: [1]
查看完整版本: 求助python beautifulsoup4 的解析指定内容的写法