RainPPR 发表于 2022-12-15 12:28

【编码问题】字符串中混有奇怪的文字,UTF-8可以显示,ANSI就?了

本帖最后由 RainPPR 于 2022-12-15 13:33 编辑

有些网站上复制一些文字,会复制出一些奇怪的字符:如:
人(ren2)这个字成了:⼈【这两个字符看起来一样,但实际上是两个字符】


【这个是正常的:人】


【这个是错误的:⼈】

把这些错误的字符复制到C++(ANSI编码)中就成了“?”
请问这是怎么回事,又有什么快捷的方式解决?求救!!!
要复制很多内容,手动一个一个挑太慢了,还容易有遗漏
如果有软件可以自动处理这些字符就更好了。谢谢各位大神!

https://static.52pojie.cn/static/image/hrline/1.gif
自己解决了(找了半天),记录下解决方案:
乱码是因为这些字符是三字节的,UTF-8中有支持,但ANSI没有支持三字节。
解决方法如下:
有些翻译软件支持了这些三字节中文(比如有道和微软的Bing),但有道的不支持中文翻译为中文(有点怪异,对不对),所有我用的Bing翻译。用繁体中文转简体中文可以很好的解决这一问题。


网址:https://cn.bing.com/translator?mkt=zh-CN


效果预览:

RainPPR 发表于 2022-12-15 13:00

那个乱码的中文好像是三字节的,正常应该是双字节,这个怎么转换{:1_904:}?

236A 发表于 2022-12-15 14:41

有道翻译 好像要收钱的

RainPPR 发表于 2022-12-15 16:03

236A 发表于 2022-12-15 14:41
有道翻译 好像要收钱的

fanyi.youdao.com
不收钱吧
页: [1]
查看完整版本: 【编码问题】字符串中混有奇怪的文字,UTF-8可以显示,ANSI就?了