吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2778|回复: 10
收起左侧

[求助] 求助,python 用正则提取中文尖括号中的内容

[复制链接]
xiaomayi2012 发表于 2019-8-5 21:58
[Python] 纯文本查看 复制代码
字符串如下:
str="《盗梦空间》(高清完整版)作者:xxxx"
re.findall(r'《(.+?)》',str)
我用正则提取《》中间的内容为空,请求指点,谢谢!

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

niebaohua 发表于 2019-8-5 22:26
为了青春 发表于 2019-8-5 22:26
在https://regex101.com这个网站用你的规则试了下,规则没问题,确实能提取出“盗梦空间”。
是不是python下规则不同啊。
帮顶下,希望有大佬来指点。
 楼主| xiaomayi2012 发表于 2019-8-5 22:28
为了青春 发表于 2019-8-5 22:26
在https://regex101.com这个网站用你的规则试了下,规则没问题,确实能提取出“盗梦空间”。
是不是python ...

我复制了这段就可以了。。我爬取网站的时候就是不行,,
mq5123 发表于 2019-8-5 22:34
本帖最后由 mq5123 于 2019-8-5 22:35 编辑

试试
re.findall(r'《(.*?)》',str)
or
re.findall(r'《([\s\S]*?)》',str)
半仙丷 发表于 2019-8-5 22:51
我这能出来啊,还有,我把+换成*也能出来,你看看吧
网络鱼 发表于 2019-8-5 23:02
.*?是万能公式
ixsec 发表于 2019-8-5 23:47
[Python] 纯文本查看 复制代码
In [5]: import re

In [6]: str="《盗梦空间》(高清完整版)作者:xxxx"

In [7]: re.findall(r'《([\w\W\u4e00-\u9fff]+)》',str)
Out[7]: ['盗梦空间']

会提取里面的中文及英文
1170 发表于 2019-8-6 00:06
xiaomayi2012 发表于 2019-8-5 22:28
我复制了这段就可以了。。我爬取网站的时候就是不行,,

爬网站没有提取到,可能是没获取到数据,提取之前检查一下时候有没有爬到数据
X_m17 发表于 2019-8-6 00:09
可以多试几条数据
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-30 11:57

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表