鸭鸭鸭? 发表于 2020-1-6 11:44

求帮忙看下python正则,匹配不出来

<div class="poem-list-item">
      <div style="display: flex;margin-bottom: 5px;">
            <a class="check-red" href="/s?wd=白日做梦&ptype=zici"data-click='{"act":"a_click_list_item"}'>
                白日做梦
            </a>
      </div>
                <div id="pinyin" class="poem-list-item-body" style="line-height: 26px;">
            [bái rì zuò mèng]<a href="#" url="https://ss0.baidu.com/6KAZsjip0QIZ8tyhnq/text2audio?tex=%E7%99%BD%28bai2%29%E6%97%A5%28ri4%29%E5%81%9A%28zuo4%29%E6%A2%A6%28meng4%29&cuid=dict&lan=ZH&ctp=1&pdt=30&vol=9&spd=4" class="mp3-play">&nbsp;</a>
      </div>
      <div class="poem-list-item-body check-red c-line-clamp1" data-ellipsis="true" data-ellipsis-max-line="1" style="line-height: 26px;">
                        比喻幻想根本不能实现。
                  </div>s2 = 'style="line-height: 26px;">[(.+?)]<a href="#" url="'
s3 = 'style="line-height: 26px;">(.+?)</div>'

p2 = re.compile(s2)
p3 = re.compile(s3)
result2 = re.findall(p2,r.content.decode('utf-8'))
result3 = re.findall(p3,r.content.decode('utf-8'))
红字内容匹配不出来,应该是换行了,还有符号太多。不知道怎么写了,有没有大神看看

lijt16 发表于 2020-1-6 18:49

这样?

鸭鸭鸭? 发表于 2020-1-7 10:15

lijt16 发表于 2020-1-6 18:49
这样?

是这样,谢谢。方括号能去掉吗

lijt16 发表于 2020-1-7 10:35

鸭鸭鸭? 发表于 2020-1-7 10:15
是这样,谢谢。方括号能去掉吗

你的正则那里把方括号放在圆括号外面就可以

lijt16 发表于 2020-1-7 10:46

鸭鸭鸭? 发表于 2020-1-7 10:15
是这样,谢谢。方括号能去掉吗

s2 = 'style="line-height: 26px;">\s*\[(.+?)\]\s*?<a href="#" url="'

不苦小和尚 发表于 2020-1-27 15:31

\[(.*?)\][\s\S]*px;">\s*(.*?)(?:\s*)</div>s2
页: [1]
查看完整版本: 求帮忙看下python正则,匹配不出来