dengsuhanglove 发表于 2020-12-4 16:09

使用正则表达式解析html

请问我怎么通过正则表达式获取到‘此房满五年,红本在手,业主诚意出售,南向采光好’ ‘’香山里‘’,‘’华侨城 ,‘’4室2厅 | 144.3平米 | 南 | 精装 | 中楼层(共33层) | 2011年建 | 板塔结合‘’,‘单价102565元/平米’这些呢


<div class="info clear"><div class="title"><a class=""target="_blank" data-log_index="4" data-el="ershoufang" data-housecode="105105829574" data-is_focus="" data-sl="">此房满五年,红本在手,业主诚意出售,南向采光好</a><!-- 拆分标签 只留一个优先级最高的标签--><span class="goodhouse_tag tagBlock">必看好房</span></div><div class="flood"><div class="positionInfo"><span class="positionIcon"></span><atarget="_blank" data-log_index="4" data-el="region">香山里 </a>   -<atarget="_blank">华侨城</a> </div></div><div class="address"><div class="houseInfo"><span class="houseIcon"></span>4室2厅 | 144.3平米 | 南 | 精装 | 中楼层(共33层) | 2011年建 | 板塔结合</div></div><div class="followInfo"><span class="starIcon"></span>2人关注 / 14天以前发布</div><div class="tag"><span class="vr">VR房源</span><span class="taxfree">房本满五年</span></div><div class="priceInfo"><div class="totalPrice"><span>1480</span>万</div><div class="unitPrice" data-hid="105105829574" data-rid="2411099930672" data-price="102565"><span>单价102565元/平米</span></div></div></div>

rsnodame 发表于 2020-12-4 19:09

{:301_1008:}人生苦短,建议你学习一下beautifulsoup、xpath这类python库,别死磕正则表达式

920067776 发表于 2020-12-5 21:29

e语言 取通用属性不知道行不行 不懂帮顶

yyjj95 发表于 2020-12-8 08:16

用xpath吧,直接获取第二个div中的所有文字就可以了。用正则比较麻烦。
页: [1]
查看完整版本: 使用正则表达式解析html