With.shadows 发表于 2021-12-14 14:45

江湖救急,批量删除文本中的简体中文

有没有大神能够帮帮忙,小弟在写bat脚本时遇到了一点问题,
带有藏语,汉语,数字,英文,常规符号,的一些srt字幕文件,我想单独删除里面的中文,其他内容不变;
但我尝试着在bat脚本中用中文编码的正则表达式去替换的时候,其他没问题,但唯独藏文不支持,最后输出藏文也给整没了,
-----------------------------------------------------------分界线----------------------------------------------
脚本内容
fr *.srt -r:"***:([\x80-\xFF])" -t

执行前后对比参照下图

With.shadows 发表于 2021-12-14 14:50

season123 发表于 2021-12-14 14:48
不错不错,还可以继续优化。还有很大的改动空间。

兄弟有什么高见指导指导,我尝试调用Unicdoe里面的编码范围,依旧无效,可能是我调用的方式不对

duanyi71 发表于 2021-12-14 14:55

很简单,Ctrl+H,搜索里填“找回”然后替换里不填任何东西,一替换就全没有了

With.shadows 发表于 2021-12-14 15:02

duanyi71 发表于 2021-12-14 14:55
很简单,Ctrl+H,搜索里填“找回”然后替换里不填任何东西,一替换就全没有了

不是的.我需要处理的文件有很多,中文文字也不仅仅局限于这些,我是想删除调文件中的所有中文文字,可能涉及到中文字符编码

wysyz 发表于 2021-12-14 15:05

用python处理吧,百度一下

qiu782461893 发表于 2021-12-14 15:07

longxing 发表于 2021-12-14 18:07

你的文本贴上来看看啊 只是截图没法试啊

sail2000 发表于 2021-12-14 20:48

这种很规律的简单,直接UE录一个宏就行

mrliu133 发表于 2021-12-14 21:10

我觉得可以统计一下词频,再将这些词进行正则替换

编程天下 发表于 2021-12-14 22:39

python正则匹配删除来个for循环批量
页: [1] 2 3
查看完整版本: 江湖救急,批量删除文本中的简体中文