吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 721|回复: 2
收起左侧

[学习记录] Windows上C++控制台应用使用Unicode的总结

[复制链接]
FDE9 发表于 2023-8-31 19:35
以前都是在linux下,没这么多事,到Windows这老是乱码,就花时间总结了一下,欢迎大佬指正。



1. 源文件用UTF-8,设置编译器选项(MSVC的/utf-8),让编译后的可执行文件中的字符串用UTF-8编码;
2. 不要用chcp(不知道是啥?那太好了),不要在区域设置里设置那个Beta的Unicode UTF-8(不知道是啥?那太好了),但在main的最开始用`::SetConsoleOutputCP(CP_UTF8);`,也就是外部输入是ANSI,输出给用户是UTF-8;
3. 程序内纯ASCII不能处理的一切以UTF-8或者UTF-16操作;
4. 接上条,从命令行窗口得到的用户输入统一是ANSI,然后用MultiByteToWideChar把ANSI转成UTF-16,【可选】再用WideCharToMultiByte再转成UTF-8;
5. 要打开文件或者其他与系统交互怎么办,要么直接用从用户那获取的ANSI编码(const char*)或者UTF-16(std::wstring, const wchar_t*)作为参数,要么把UTF-8转成UTF-16,怎么转?再看看MultiByteToWideChar的第一个参数。
```cpp
#include <Windows.h>
#include <fstream>
#include <iostream>
#include <stdlib.h>
#include <string.h>
#include <string>
std::string ConvertWideToUTF8(const std::wstring& wstr)
{
    int count = WideCharToMultiByte(CP_UTF8, 0, wstr.c_str(), wstr.length(), NULL, 0, NULL, NULL);
    std::string str(count, 0);
    WideCharToMultiByte(CP_UTF8, 0, wstr.c_str(), -1, &str[0], count, NULL, NULL);
    return str;
}
std::wstring ConvertACPToWide(const char* str)
{
    if (!str || strlen(str) == 0)
    {
        return {};
    }
    int count = MultiByteToWideChar(CP_ACP, 0, str, -1, NULL, 0);  // CP_ACP指代系统默认的ANSI Code Page
    count -= 1;
    std::wstring wstr(count, 0);
    MultiByteToWideChar(CP_ACP, 0, str, -1, &wstr[0], count);
    return wstr;
}
std::string GetUtf8String(const char* str)
{
    return ConvertWideToUTF8(ConvertACPToWide(str));
}
void print(const char* c, size_t n) {
    for (size_t i = 0; i < n; i++) {
        printf("%x ", (uint8_t)c);
    }
    printf("\n");
}
int main(int argc, char* argv[])
{
    ::SetConsoleOutputCP(CP_UTF8);
    if (argc > 1) {
        print(argv[1], strlen(argv[1]));
        std::string arg1 = GetUtf8String(argv[1]);
        print(arg1.c_str(), arg1.size());
        printf("%s\n", arg1.data());
        std::ifstream inANSI(argv[1], std::ios::binary);
        if (inANSI.is_open()) {  // 能正常打开
            char buf[64]{ 0 };
            inANSI.read(buf, 63);
            printf("%s", buf);
        }
        printf("\n");
        auto filename = ConvertACPToWide(argv[1]);  // UTF-16
        std::ifstream inUNICODE(filename.c_str(), std::ios::binary);
        if (inUNICODE.is_open()) {  // 能正常打开
            char buf[64]{ 0 };
            inUNICODE.read(buf, 63);
            printf("%s", buf);
        }
        printf("\n");
        std::ifstream inUTF8(arg1.c_str(), std::ios::binary);
        if (!inUTF8.is_open()) {  // 不能打开
            printf("无法打开。&#128557;\n");
        }
    }
    std::string input;
    std::getline(std::cin, input);
    print(input.data(), input.size());
    auto path = ConvertWideToUTF8(ConvertACPToWide(input.c_str()));
    print(path.data(), path.size());
    const char* str = "你好,世界。の&#128512;";
    printf("%s\n", str);
    (void)getchar();
}
```

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

苏紫方璇 发表于 2023-9-4 00:26
粘贴代码可以参考下边这个帖子
【公告】发帖代码插入以及添加链接教程(有福利)
https://www.52pojie.cn/thread-713042-1-1.html
(出处: 吾爱破解论坛)
MoreWindows123 发表于 2023-9-13 12:34
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2025-1-10 21:22

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表