sakura32 发表于 2023-11-15 09:17

python调用7zip命令行,stdout无法显示文件名中的特殊字符

本帖最后由 sakura32 于 2023-11-15 16:37 编辑

如题,我需要查看压缩包内部文件结构,但是使用7zip的l指令后读取的stdout无法显示特殊字符,被替换为了"_",不清楚是7zip的问题还是cmd的问题。

代码如下:
import subprocess

path_7zip = '7-Zip/7z.exe'
filepath = r'F:\解压测试❤.zip'https://i.postimg.cc/pd6bzptW/QQ-20231115091828.png

command_l =
process_l = subprocess.run(command_l,
                           stdout=subprocess.PIPE,
                           creationflags=subprocess.CREATE_NO_WINDOW,
                           text=True,
                           universal_newlines=True)
if process_l.returncode == 0:
    stdout_line = process_l.stdout
    print(stdout_line)

原文件名为"解压测试❤.zip",但是stdout中为"解压测试_.zip"(&#10084是一个实心爱心字符)

stdout输出结果:
7-Zip 23.01 (x64) : Copyright (c) 1999-2023 Igor Pavlov : 2023-06-20

Scanning the drive for archives:
1 file, 360559 bytes (353 KiB)

Listing archive: F:\解压测试_.zip

--
Path = F:\解压测试_.zip
Type = zip
Physical Size = 360559

   Date      Time    Attr         Size   CompressedName
------------------- ----- ------------ ------------------------------------
2023-10-02 13:09:00 ....A      1173284       360169文件1.xlsx
2023-11-02 13:44:02 ....A         21         24文件2.txt
------------------- ----- ------------ ------------------------------------


已经试过的方法:
1.subprocess中添加参数encoding='utf-8',会报错UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbd in position 162: invalid start byte
2.stdout+encode+decode,无法解决

ModelPorter 发表于 2023-11-15 15:33

你把decode的编码, 换成gbk试试
Windows系统默认的编码是gbk, 不是utf-8

sakura32 发表于 2023-11-15 16:35

ModelPorter 发表于 2023-11-15 15:33
你把decode的编码, 换成gbk试试
Windows系统默认的编码是gbk, 不是utf-8

gbk也试过了,7zip命令行里加-sscwin或-sscutf-8也试过了
页: [1]
查看完整版本: python调用7zip命令行,stdout无法显示文件名中的特殊字符