吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1776|回复: 13
收起左侧

[求助] python怎么抓取“响应”中的数据呢?

[复制链接]
csmy2012 发表于 2021-11-10 15:17
想抓取新闻和报纸摘要的新闻标题,网址是:http://china.cnr.cn/news/index.html
通过工具抓到端口是:http://apppc.cnr.cn/kuaixun
这个网址直接是打不开的,报“500错误”
505.JPG
但是在“响应”里是能看到数据的,
002.JPG
这样的怎么抓取啊?
用requests.get()抓不到数据呢
03.JPG
请大神们教我,谢谢!

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

Prozacs 发表于 2021-11-10 15:32
post 。。。。看清楚哦。不是get
fanai 发表于 2021-11-10 15:34
楚子沦i 发表于 2021-11-10 15:48
http://china.cnr.cn/news/20211110/t20211110_525657316.shtml

随便打开一个链接,分析一下就好了啊
打开f12,然后查看network
刷新网页
一直向下翻有一个rebang的请求,是请求你说的那个端口链接。

Request URL: https://apppc.cnr.cn/rebang
Request Method: POST
Status Code: 200 OK
Remote Address: 36.150.103.19:443
Referrer Policy: strict-origin-when-cross-origin

他的请求是post。
改个请求头,然后带上ua,防盗链再请求试试。
不过其实如果你只是单单要他的数据的话,直接请求http://china.cnr.cn/news/20211110/t20211110_525657316.shtml这个链接,然后用xpath提就行了把。
UndCover 发表于 2021-11-10 15:48
这个是post请求,
wqc1234 发表于 2021-11-10 15:57
Post啊这是
ghell 发表于 2021-11-10 16:04
本帖最后由 ghell 于 2021-11-10 16:05 编辑

楼主这个需求,仅仅是抓新闻标题,直接在elements里用xpath定位就能找到,用浏览器F12仔细找一下就有,xpath=/html/body/div[1]/div[2]/div[3]/div[1]/div[1]

如果要拿到network里的response内容,requests包是不行的,用selenium,然后分析浏览器的log,就可以了:logs = [json.loads(log['message'])['message']['params'] for log in browser.get_log('performance')]

或者直接用第三方增强的seleniumwire,可以直接获取request/response,原理是内置了一个proxy
xian54966 发表于 2021-11-10 16:09
你连代码都不放,怎么知道问题出在哪?
骑狗的猴子 发表于 2021-11-10 16:29
首先你要看下 请求方法  其次,你要带上 UA头 等一些必要的请求头  这样才能有数据返回
亿联网络 发表于 2021-11-10 16:34
import json

import requests

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36",
    "Content-Type": "application/json; charset=UTF-8"
}

data = {
    "day": "2021-11-10",
    "lastNewsId": "0",
    "pageIndex": 1,
    "perPage": 10
}
resp = requests.post(url="http://apppc.cnr.cn/kuaixun", data=json.dumps(data), headers=headers)
print(resp.text.encode("ISO-8859-1").decode("utf-8"))

免费评分

参与人数 1吾爱币 +1 热心值 +1 收起 理由
952712345 + 1 + 1 我很赞同!

查看全部评分

您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 20:34

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表