吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1077|回复: 7
收起左侧

[求助] 乱码问题

[复制链接]
小小的石头13 发表于 2021-9-6 14:19
本帖最后由 小小的石头13 于 2021-9-6 14:21 编辑

如题python爬虫返回的数据乱码了:
不知道怎么解码
_N__B@8[C3}$N}5W8IA[AY2.png

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

hzw112233 发表于 2021-9-6 14:38
这个应该是用ISO8859-1读取GBK导致的,转码就行

免费评分

参与人数 1吾爱币 +1 热心值 +1 收起 理由
小小的石头13 + 1 + 1 谢谢@Thanks!

查看全部评分

magicianly 发表于 2021-9-6 14:28
这明显是乱码了,还怎么解?你在二进制里面取页面的编码格式,然后用那个编码格式解析就不会出这种问题了
头像被屏蔽
mokson 发表于 2021-9-6 14:30
ofo 发表于 2021-9-6 14:38
加密了,解密还原
 楼主| 小小的石头13 发表于 2021-9-6 14:41
hzw112233 发表于 2021-9-6 14:38
这个应该是用ISO8859-1读取GBK导致的,转码就行

谢谢!确实可以了,但什么是ISO8859-1,还有其他的吗?
dingyx99 发表于 2021-9-6 14:45
小小的石头13 发表于 2021-9-6 14:41
谢谢!确实可以了,但什么是ISO8859-1,还有其他的吗?

ISO 8859-1,正式编号为ISO/IEC 8859-1:1998,又称Latin-1或“西欧语言”,是国际标准化组织内ISO/IEC 8859的第一个8位字符集。它以ASCII为基础,在空置的0xA0-0xFF的范围内,加入96个字母及符号,藉以供使用附加符号的拉丁字母语言使用。曾推出过 ISO 8859-1:1987 版。

ISO-8859-1的别名有: iso-ir-100, csISOLatin1, latin1, l1, IBM819. Oracle数据库称WE8ISO8859P1。
Guation 发表于 2021-9-6 16:39
乱码肯定是编码问题 你得先去查一下被爬的网站使用的是什么编码 你得用相同的编码去读 之后再转码成你需要的编码保存下来
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 22:54

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表