plaodj 发表于 2022-5-21 13:39

再次求助 python beautifulsoup4 的两个问题

上一个问题 解决了 谢谢相助
搜索复制

再次求助两个问题

代码1:
<li>
                                <div class="input_name1">等级:</div>
                                <select name="TYPES" class="term1_select">
                                        <option value="0">普通</option>
                                        <option value="1">VIP</option>
                                        <option value="2">svip</option>
                                </select>
<img src="about:blank" onerror="$(this).prev('select').val( '0' );$(this).css('display','none')">
                        </li>
怕代码变形上个图片


一段 li 段代码如上是根据 li代码段里面 imgsrc 这个里面的代码   val(‘’)里的这个值 匹配对应的 option   怎么获取这个 val呢???   因为其它的 项目也是这样方式所以无法简单的获取如下代码



怎么获取这个对应项目的val值   即value   


https://static.52pojie.cn/static/image/hrline/1.gif


问2

如代码:
        <div style="width:100%;float:left;margin-top:15px;">
                                        <div style="margin-left:95px;width:111px;text-align:left;float:left;">
                                                                <input type="checkbox" name="CERTIFY[]" value="8002">
                                                                启明星勋章
                        </div>
                                        <div style="margin-left:95px;width:111px;text-align:left;float:left;">
                                                                <input type="checkbox" name="CERTIFY[]" value="8003">
                                                                终身荣誉勋章
                        </div>
                                        <div style="margin-left:95px;width:111px;text-align:left;float:left;">
                                                                <input type="checkbox" name="CERTIFY[]" value="8004">
                                                                微信绑定勋章
                        </div>
                                        <div style="margin-left:95px;width:111px;text-align:left;float:left;">
                                                                <input type="checkbox" name="CERTIFY[]" value="8005">
                                                                爱心大使勋章
                        </div>
                                        <div style="margin-left:95px;width:111px;text-align:left;float:left;">
                                                                <input type="checkbox" name="CERTIFY[]" checked value="8006">
                                                                荣誉团长勋章
                        </div>
                                        <div style="margin-left:95px;width:111px;text-align:left;float:left;">
                                                                <input type="checkbox" name="CERTIFY[]" checked value="8007">
                                                                微勋章
                        </div>
                        </div>

怕代码变形上传图片:


name="CERTIFY[]"这个 应该是一种数组类型   可能有多个值    python beautifulsoup在解析这个html的时候 怎么根据checked 然后获取相应的 value?

vista_info 发表于 2022-5-21 14:29

xpath 能做到吧 具体的情况看网页了

unmask 发表于 2022-5-21 19:10

kai-memory 发表于 2022-5-21 14:29
xpath 能做到吧 具体的情况看网页了

# quest1
import re
val = re.sub(r".*val\(\s*'([^']*).*", r"\1", bs.find('select',
                                                   {'name': 'TYPES'}).find_next('img')["onerror"])

# quest2
CERTIFY = for ele in bs.find_all(
    'input', {'type': 'checkbox', 'name': 'CERTIFY[]', 'checked': True})]
页: [1]
查看完整版本: 再次求助 python beautifulsoup4 的两个问题