吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1273|回复: 3
收起左侧

[求助] 抓取失败,该怎么修改

[复制链接]
wzw307621 发表于 2020-5-6 22:05
[Python] 纯文本查看 复制代码
from urllib import request
import json
import time
from datetime import datetime
from datetime import timedelta




# 获取数据,根据url获取
def get_data(url):
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.122 Safari/537.36'
    }
    req = request.Request(url, headers=headers)
    response = request.urlopen(req)
    if response.getcode() == 200:
        return response.read()
    return None

if __name__ == '__main__':
    html = get_data('http://www.nnedu.com/App.Search/index.php?m=Search&c=Resource&a=index&ph=03&s=01&pb=01&b=0101010101-412&from=ew)
    print(html)


抓取这个网址下的就会报错,换其他网站的就可以显示正常内容
image.png
image.png

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

华月方昊 发表于 2020-5-6 22:15
可能他反扒了。我也不清楚。你试试加个浏览器标示。。可能服务器拒绝访问吧。
hill_king 发表于 2020-5-6 22:17
lntuer 发表于 2020-5-6 22:29
[Python] 纯文本查看 复制代码
import requests
import json
import time
from datetime import datetime
from datetime import timedelta
# 获取数据,根据url获取
def get_data(url):
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.122 Safari/537.36'
    }
    req = requests.get(url, headers=headers)
    if req.status_code== 200:
        return req.text
    return None


if __name__ == '__main__':
    html = get_data('http://www.nnedu.com/App.Search/index.php?m=Search&c=Resource&a=index&ph=03&s=01&pb=01&b=0101010101-412&from=ew')
    print(html)

用requests模块不想吗?非要用啥urllib

免费评分

参与人数 1吾爱币 +1 热心值 +1 收起 理由
wzw307621 + 1 + 1 非常感谢!新手不懂包里都有什么方法。。。。

查看全部评分

您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-26 16:32

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表