gksj 发表于 2024-5-11 22:33

文本编码分析助手

本帖最后由 gksj 于 2024-5-11 22:38 编辑

## 前言
你是否经常遇到过乱码的文本内容?比如:
                `廳椡曗彏帺摦挷惍幚峴踢鄹拮
                尨揰巔惃偱帺摦廳椡曗彏愝掕偱偒側偄応崌偼丄偙偙偱揔愗側埵抲傊堏摦張棟傪擖傟傞`
那么这个工具可能会适合你.
## 软件介绍
本软件是辅助分析多字节编码文本的辅助工具,可以根据文本的字符编码来分析可能的原始文本编码类型,多用于非本地语言的ansi编码文本.
## 软件截图


## 软件说明
1.文件路径: 路径支持鼠标拖入文件和文件选择对话框两种方式.
2.分析模式: 支持 文本文件 字符编码,文件地址 三种模式
3:文本文件模式: 仅支持纯文本文件格式,选择文件后自动读取原数据和分析编码后的转换数据.
4.字符编码模式:支持 十进制 十六进制 字符串 三种模式
十进制格式:0~255纯数字,分隔符为英文的逗号","
十六进制格式:00~FF,分隔符为空格" "
         字符串格式:可直接粘贴乱码的字符串,软件会自动以本地计算机的ansi编码格式对字符进行解析(中文编码为gb18030)
      5.文件地址模式:支持任意类型的文件,根据16进制的文件地址读取对应数据,并分析对应编码,然后输出分析结果.
      6.编码分析相关代码使用
      https://github.com/CharsetDetector/UTF-unknown
      7.为了方便使用把代码直接嵌入到了软件内,并修改了部分代码来适应简体中文系统使用.
      8.软件采用VS2019+Net Framework 4.0编译,编译为X64,不支持32位操作系统,自行安装Net Framework运行库.
## 解压密码为 52pojie
单文件压缩文件(普通用户下载):



有C#程序开发经验的程序员可下载源代码(非程序员请勿下载,只包含核心代码,无法一键编译!)

chishingchan 发表于 2024-5-11 23:29

本帖最后由 chishingchan 于 2024-5-11 23:33 编辑

跟我这个在功能上有点像!
https://www.autoitx.com/data/attachment/forum/202309/18/165718jnwsgbbw1sg3inwg.png
可以手工选择 简繁日韩 进行识别,不懂如何根据文字编码自动识别!
如果可以的话,请指教,谢谢!

gksj 发表于 2024-5-14 21:51

gzsklsskszngc 发表于 2024-5-14 19:51
https://github.com/tomwillow/SmartCharsetConverter/releases

1.我只是一个自学C#的入门程序员,初级程序员都算不上,严格的说都算不上程序员.
2.我对C++一窍不通.
3.我只是分享我在实际工作过程中需要用到的工具或者插件功能,来独立编译出来一个实用的小软件.
4.我分享的所有工具都完全开放源代码,方便高手继续完善功能和修正错误

另外你提到的软件,请看说明文件
https://github.com/tomwillow/SmartCharsetConverter
NO.1:"支持越南语字符集(VNI/VPS/VISCII/TCVN3)和其他字符集互转(目前还不能自动探测这几个字符集,请使用“不过滤”模式)"
重点内容是"目前还不能自动探测这几个字符集",至于原因我大概知道原因,但我没能力解决.包括这个开源库的大佬也是没有好办法.
NO.2:"我在对比了诸多字符集探测库之后,选定了 Notepad3 使用的魔改版 uchardet,这个魔改版 uchardet 经过 Notepad3 作者精心调教,精度比原版 uchardet 更高!并且又使用了 icu 库提供的字符集探测功能,结合 uchardet+icu 两者综合判断给出探测结果!"
重点内容是:提到了魔改版的uchardet,这是重点.你可以看一下我说明内容里提到的开源库地址,里面的说明里面写明了:
https://github.com/CharsetDetector/UTF-unknown
"This package is based on Ude and since version 2 also on uchardet, which are ports of the Mozilla Universal Charset Detector。"
意思就是这个开源库也是基于uchardet,也就是说UTF-unknown是将c++代码的uchardet,翻译成了C#语言的UTF-unknown.
他们本质上是一样,只是你提供的软件和我分享的软件是不同语言编译的,而且都是改版的.

非常感谢你提供的软件地址,相信你提供的软件比我开发的软件功能要强大(核心算法我没有修改,只是简单改一改适应中文,因为这个插件原作者并非多字节编码语言的国家的人,所以侧重点也不在多字节编码检测)
我会继续努力学习和探索,谢谢.

甜萝 发表于 2024-5-11 22:41

已经很少遇见过乱码情况了

三滑稽甲苯 发表于 2024-5-11 22:59

现在用 vscode 可以自动检测编码,相关软件就用的少了

ZhjhJZ 发表于 2024-5-11 23:23

这个软件还是有用的{:1_921:}

LiveOnLove 发表于 2024-5-12 00:41

这个不错,偶尔收到的电子邮件就是这样的东西。得改编码。

jiqimaoer 发表于 2024-5-12 01:13

学习一下处理编码

cn00417984 发表于 2024-5-12 01:19

是的偶尔玩国际中文版的游戏会遇到过

sxzswx 发表于 2024-5-12 05:19

鹿坪 发表于 2024-5-12 07:50

有时候还是用得上的,谢谢分享
页: [1] 2 3 4 5 6
查看完整版本: 文本编码分析助手