吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 3466|回复: 9
收起左侧

[已解决] 用python 的requests 模块解析网页源代码报code = 400错误。

[复制链接]
老冉 发表于 2019-7-4 13:58
本帖最后由 老冉 于 2019-7-11 00:09 编辑

url = https://api.bilibili.com/playurl?callback=callbackfunction&aid=19956343&page=65&platform=html5&quality=1&vtype=mp4&type=jsonp&_=1562215557403

我用chrome 打开网页正常,用 Ctrl + U 也能查看网页的源代码,但是用 python 的 requests 模块,selenium 都不能正常解析该网页的源代码,报 code = 400 错误。请大神帮助看看问题所在?

谢谢!!

>>> import requests
>>> url = r'https://api.bilibili.com/playurl?callback=callbackfunction&aid=19956343&page=65&platform=html5&quality=1&vtype=mp4&type=jsonp&_=1562215557403'
>>>
>>> h = requests.get(url)
>>> h
<Response [200]>
>>> h = h.text
>>> h
'callbackfunction({"code":40000,"message":"bad request"});'
>>>

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

li231475 发表于 2019-7-4 14:06
你headers都不设置的么?
pwp 发表于 2019-7-4 14:23

你headers都不设置的么?+1
你pycharm都不用的么?
你代码都不保存的么?
kicebeauty 发表于 2019-7-4 14:32
400不就是服务器拒绝吗,肯定是headers没设置咯,大多数网站禁止非浏览器接入。
minjun2046 发表于 2019-7-4 14:32
好歹告诉哔哩哔哩你是个什么啊!!就是设置headers
kge369 发表于 2019-7-4 14:56
在h = 之前 配置headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.117 Safari/537.36'}

h =  requests.get(url,headers=headers)

看下
yumusb 发表于 2019-7-4 14:56
模拟 模拟 模拟!!!
lijiusong 发表于 2019-7-4 15:05
#coding=utf-8
import requests
header={"Accept":"text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8",
"Accept-Encoding":"gzip, deflate, br",
"Accept-Language":"zh-CN,zh;q=0.9",
"Cache-Control":"max-age=0",
"Connection":"keep-alive",
"Cookie":"CURRENT_FNVAL=16; buvid3=7D1AC0A0-88B0-453C-8F42-4AD5DD09000484586infoc; stardustvideo=1; rpdid=iwmkmwsoiidospqmilkxw; __guid=231148239.731019756462000900.1562223228121.9128; monitor_count=3",
"Host":"api.bilibili.com",
'If-None-Match':'"602555680aeba463c3cd8e598e653ce0"',
"Upgrade-Insecure-Requests":"1",
"User-Agent":"Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36"
}
url='https://api.bilibili.com/playurl?callback=callbackfunction&aid=19956343&page=65&platform=html5&quality=1&vtype=mp4&type=jsonp&_=1562215557403'
req=requests.get(url,headers=header).text
print(req)



楼猪不妨试试这个代码!!
寒尘丶Coldust 发表于 2019-7-4 15:49
lijiusong 发表于 2019-7-4 15:05
#coding=utf-8
import requests
header={"Accept":"text/html,application/xhtml+xml,application/xml;q= ...

Cookie有的最好脱敏一下
 楼主| 老冉 发表于 2019-7-10 17:07
lijiusong 发表于 2019-7-4 15:05
#coding=utf-8
import requests
header={"Accept":"text/html,application/xhtml+xml,application/xml;q= ...

试了一下,成了, 非常感谢楼主的帮助!
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-27 04:17

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表