吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1275|回复: 11
收起左侧

[已解决] 爬虫爬出的页面不是乱码就报错,求帮忙解答下

[复制链接]
storm 发表于 2020-9-23 08:40
本帖最后由 storm 于 2020-9-24 10:52 编辑

[Python] 纯文本查看 复制代码
# -*- coding: utf-8 -*-
# [url=home.php?mod=space&uid=238618]@Time[/url] : 2020/9/23 8:13
# [url=home.php?mod=space&uid=267492]@file[/url] : Xpath
from lxml import etree
import requests

# 请求头
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36'
}
url = 'https://www.lmonkey.com/'
res = requests.get(url,headers=headers)
#响应代码
code = res.status_code
#判断响应结果
if code == 200:
    print('响应成功')
#     写入文件
    with open('./test.html','w') as fp:
        fp.write(res.text)


然后报错
QQ截图20200923083929.png 昨天还能出来的  不过是乱码   请问下这种情况是什么原因造成的 ,我在百度上找,也没找到个合适的解决方法

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

woshijvm 发表于 2020-9-23 08:47
明显是编码问题
culprit 发表于 2020-9-23 08:53
 楼主| storm 发表于 2020-9-23 08:55

我也想估计是编码的原因 请教下怎么改变编码然后写入文件中
JackLove1234 发表于 2020-9-23 09:01
本帖最后由 JackLove1234 于 2020-9-23 09:08 编辑

from lxml import etree
import requests

# 请求头
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36'
}
url = 'https://www.lmonkey.com/'
res = requests.get(url,headers=headers)
#响应代码
print(res.encoding)
code = res.status_code
#判断响应结果
if code == 200:
    print('响应成功')
#     写入文件
    with open('./test.html','w',encoding='utf-8') as fp:
        fp.write(res.text)
木子汐 发表于 2020-9-23 09:06
# -*- coding: utf-8 -*-
# @Time : 2020/9/23 8:13
# @file : Xpath
from lxml import etree
import requests

# 请求头
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36'
}
url = 'https://www.lmonkey.com/'
res = requests.get(url,headers=headers)
#响应代码
code = res.status_code
#判断响应结果
if code == 200:
    print('响应成功')
#     写入文件
    with open('./test.html','w', encoding='utf-8') as fp:
        fp.write(res.text)
头像被屏蔽
细水流长 发表于 2020-9-23 09:06
提示: 作者被禁止或删除 内容自动屏蔽
JackLove1234 发表于 2020-9-23 09:08

这位大哥说的对

[Asm] 纯文本查看 复制代码
from lxml import etree
import requests
 
# 请求头
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36'
}
url = 'https://www.lmonkey.com/'
res = requests.get(url,headers=headers)
#res.encoding = res.apparent_encoding
#响应代码
print(res.encoding)
code = res.status_code
#判断响应结果
if code == 200:
    print('响应成功')
#     写入文件
    with open('./test.html','w',encoding='utf-8') as fp:
        fp.write(res.text)
 楼主| storm 发表于 2020-9-23 09:22
JackLove1234 发表于 2020-9-23 09:01
from lxml import etree
import requests

感谢您的回答 谢谢
 楼主| storm 发表于 2020-9-23 09:23
木子汐 发表于 2020-9-23 09:06
# -*- coding: utf-8 -*-
# @Time : 2020/9/23 8:13
# @file : Xpath

十分感谢您的回答
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-26 12:43

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表