江湖救急,批量删除文本中的简体中文
有没有大神能够帮帮忙,小弟在写bat脚本时遇到了一点问题,带有藏语,汉语,数字,英文,常规符号,的一些srt字幕文件,我想单独删除里面的中文,其他内容不变;
但我尝试着在bat脚本中用中文编码的正则表达式去替换的时候,其他没问题,但唯独藏文不支持,最后输出藏文也给整没了,
-----------------------------------------------------------分界线----------------------------------------------
脚本内容
fr *.srt -r:"***:([\x80-\xFF])" -t
执行前后对比参照下图
season123 发表于 2021-12-14 14:48
不错不错,还可以继续优化。还有很大的改动空间。
兄弟有什么高见指导指导,我尝试调用Unicdoe里面的编码范围,依旧无效,可能是我调用的方式不对 很简单,Ctrl+H,搜索里填“找回”然后替换里不填任何东西,一替换就全没有了 duanyi71 发表于 2021-12-14 14:55
很简单,Ctrl+H,搜索里填“找回”然后替换里不填任何东西,一替换就全没有了
不是的.我需要处理的文件有很多,中文文字也不仅仅局限于这些,我是想删除调文件中的所有中文文字,可能涉及到中文字符编码 用python处理吧,百度一下 你的文本贴上来看看啊 只是截图没法试啊 这种很规律的简单,直接UE录一个宏就行 我觉得可以统计一下词频,再将这些词进行正则替换 python正则匹配删除来个for循环批量