吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1965|回复: 11
收起左侧

[已解决] Python爬虫的正则表达式书写

[复制链接]
dengfhqqq 发表于 2019-7-23 14:46
本帖最后由 dengfhqqq 于 2019-7-23 15:04 编辑

自学Python几天,刚刚遇到了一个正则表达式不太会写。
想爬某个网站的帖子标题下来,但是他标签里既有单引号又有双引号比较棘手,求帮助。。
<div class="recmd-right">
<a class="recmd-content" href="/article/121210368" target="_blank">设计师你出来,我保证不打屎你。</a>

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

luopo 发表于 2019-7-23 14:48
<a class="recmd-content" href="/article/121210368" target="_blank" onclick="_hmt.push(['_trackEvent','web-list-user','chick'])">(.*?)</a>

这里的 (.*?) 就可以是你需要的东西了啊???!!!!还是我理解错误
依旧沉沉 发表于 2019-7-23 14:48
itachy 发表于 2019-7-23 14:49
兄嘚   我要将“设计师你出来,我保证不打屎你。”当作标题???   请贴出网页源码    你具体要什么?
依旧沉沉 发表于 2019-7-23 14:50
href="\/article\/(\d+)"[\S\s\n]*?>(.*?)</a> TIM截图20190723144945.png
这样可以吗

免费评分

参与人数 1吾爱币 +1 热心值 +1 收起 理由
dengfhqqq + 1 + 1 热心回复!

查看全部评分

 楼主| dengfhqqq 发表于 2019-7-23 14:59
luopo 发表于 2019-7-23 14:48
(.*?)

这里的 (.*?) 就可以是你需要的东西了啊???!!!!还是我理解错误

我知道,但是写成pattern引号不匹配
 楼主| dengfhqqq 发表于 2019-7-23 15:01
依旧沉沉 发表于 2019-7-23 14:50
href="\/article\/(\d+)"[\S\s\n]*?>(.*?)
这样可以吗

给力 谢谢 刚学python随便找点东西爬爬
 楼主| dengfhqqq 发表于 2019-7-23 15:02
依旧沉沉 发表于 2019-7-23 14:48
你想要获取什么信息呢

就中文那个标题,刚学随便找点东西爬爬而已
hkent 发表于 2019-7-23 15:09
占个位置 ,以后可以用到
minjun2046 发表于 2019-7-23 15:35
引号用转换符\"
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2025-1-12 20:05

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表