吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 3236|回复: 39
收起左侧

[原创工具] 【开源】【Python正则】搜索电脑里 包含两个任意含位置词汇的文档

[复制链接]
onlyclxy 发表于 2023-7-7 20:40
本帖最后由 onlyclxy 于 2023-7-17 10:32 编辑

这个是之前用作生产力写的小工具。并且我暂未找到其他有这样功能的软件。有的话请大佬指个路。


更新:
根据评论建议 可以加入多条路径,路径间用逗号分割
增加win7可使用的版本

两次正则搜索5.rar - 蓝奏云 (lanzoul.com)





这个之前没表达明白是干嘛用的. 就再介绍一下.

比如我有很多代码文件, 里面调用了很多不同的函数命令,  需要找到同时引用A函数和B函数的代码文件有哪些, (检测这样的文件有没有bug)  这个也是当时写这个类似背景下写的这个程序.
本来想再找个案例的..然后发现好像找不到能用正则的案例了

所以我把标题的正则去了... 但是实际上python代码里写的搜东西确实用了正则搜索.. 所以一般用普通搜东西,你很可能搜不出来..


比如你希望找一个文档里, 包含123 又包含789的文本文档. 123和789的位置不固定,可能是任何位置. 就可以用这个程序.第一遍输入\b123\b,第二遍搜索\b789\b.
原理是先搜索路径下包含123的文档, 然后在已经搜到的这些文档下,再次搜索包含789的文档.

\b123\b是一个正则表达式,它用于匹配精确的单词"123"。在正则表达式中,\b表示单词边界,即字符"123"前后不能有字母、数字或下划线。因此,\b123\b将仅匹配独立的"123"单词,而不会匹配类似"1234"或"123abc"等包含"123"的部分单词。

这个正则表达式可以用于各种文本处理任务,例如在搜索、替换或提取文本中特定的单词。

注意: 这个需要先把正则写好测试好再搜,,要不然不对的正则什么也搜不出来.. 网上有那种测试正则的在线网页可以试. 正常写不出来的话,可以让gpt帮你写的


背景:本来是需要在一个工程里找到有引用两个属性的文档。这样的文档大概有6万多个 大概找到是 type=菜   name=烧鸡 包含这样的文档。 然后现有的软件,也只能搜一遍正则,而且正则写了半天也无法找到没有固定位置的有这两个词汇的文档。就写了个这个用于搜索文本

image.png


两次正则搜索.rar - 蓝奏云 (lanzoul.com)


经楼下热心大佬llc_cn介绍,everything是有这种搜文本内容功能的!!! 我顺便把这个功能也贴出来供大家参考!!
搜索是路径加content:要搜的内容,比如:
"D:\两次正则搜索\测试文本\" content:1
"D:\两次正则搜索\测试文本\" content:1 content:2
"D:\两次正则搜索\测试文本\" content:1  content:2  content:3
image.png

但是测试发现这个有个问题,有些编码搜不到,后来更新了一下发现可以把content换成ansicontent,我这基本上搜的就差不多了
"D:\两次正则搜索\测试文本\" ansicontent:1  ansicontent:2
image.png

然后就是这样正常搜的是全部文件,可以先改搜索类型再搜,要不然全部文件搜的慢,或者手动加扩展名也行,例如下面这个:
"D:\两次正则搜索\测试文本\" .txt ansicontent:1  ansicontent:2
image.png

不过我这边测试everything并不能用正则搜索内容,要是用正则搜多个内容,暂时我这个程序还能用一用:
比如搜<[^>]+>([^<]+)<\/[^>]+>
这个正则表达式用于提取 HTML 标签中的文本内容。它将匹配任意 HTML 标签,并从中提取出标签内的文本部分。具体而言,它会匹配 < 开始的标签起始部分,然后匹配一个或多个非 > 符号,接着匹配 > 符号及其后的文本内容,最后匹配 </ 和对应的标签名,从而完成提取操作。

image.png

两次正则搜索.rar - 蓝奏云 (lanzoul.com)

免费评分

参与人数 6吾爱币 +11 热心值 +6 收起 理由
fu520 + 1 + 1 热心回复!
hellomonkiy + 1 + 1 用心讨论,共获提升!
dddou2000 + 1 + 1 谢谢@Thanks!
风之暇想 + 7 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
confiant + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
bldx + 1 + 1 谢谢@Thanks!

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

llc_cn 发表于 2023-7-12 10:38
onlyclxy 发表于 2023-7-11 10:24
是搜索文本内容
我这边能找到的搜索工具,不能搜不连续的词汇..(或者是我还不知道方法)比如em ...

我平时搜索文档内容用everything,同时包含的语法是:
路径\ content:"内容1" content:"内容2"
不同文本的那个content之间用空格隔开就是and的意思

免费评分

参与人数 1吾爱币 +3 热心值 +1 收起 理由
onlyclxy + 3 + 1 感谢大佬经验分享!!!

查看全部评分

ptrunner 发表于 2023-7-7 20:52
抖阴视频 发表于 2023-7-7 22:43
雾都孤尔 发表于 2023-7-7 22:50
学习下,支持原创!
 楼主| onlyclxy 发表于 2023-7-7 23:19
抖阴视频 发表于 2023-7-7 22:43
正则没学好就不要解释了

要是纯解释正则, 怕就没人用了
大部分普通人都不会了
woaixueix123 发表于 2023-7-8 00:53
收藏了,天天找东西找不到
li6601350 发表于 2023-7-8 01:05
学习下,支持原创!
lizhipei78 发表于 2023-7-8 09:44
不明,是说搜索文本里面的文字吗?
还是搜索包含这两个关键词的标题文档
baigei2333 发表于 2023-7-8 10:06
抖阴视频 发表于 2023-7-7 22:43
正则没学好就不要解释了

大佬 想学好正则应该看什么书的?我纯小白 网络工程师方向
odinchu 发表于 2023-7-8 11:33
谢谢分享,学习下
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-23 15:52

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表