利用python模拟请求进行成绩查询
# 昨天浏览网站的时候看到一个帖子,大意是如何用python去模拟网站进行成绩查询,于是有了这个帖子## 先把代码放上来
```
# coding: utf-8
import requests
session = requests.session()
headers = {
'Connection': 'keep-alive',
'Pragma': 'no-cache',
'Cache-Control': 'no-cache',
'Accept': 'application/json, text/javascript, */*; q=0.01',
'DNT': '1',
'X-Requested-With': 'XMLHttpRequest',
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36',
'Content-Type': 'application/x-www-form-urlencoded; charset=UTF-8',
'Origin': 'https://411318.yichafen.com',
'Sec-Fetch-Site': 'same-origin',
'Sec-Fetch-Mode': 'cors',
'Sec-Fetch-Dest': 'empty',
'Referer': 'https://411318.yichafen.com/public/queryscore/sqcode/MsTcIn3mOTU1MnxkOGFiNDUzMWJjOGY3MjhiY2ZkN2FiZmQ0MmE0YzgxOXw0MTEzMTgO0O0O.html',
'Accept-Language': 'zh-CN,zh;q=0.9,en;q=0.8',
}
def get_cookies():
response = session.get(url='https://411318.yichafen.com', headers=headers)
print(response.cookies)
def get_score():
response = session.get('https://411318.yichafen.com/public/queryresult.html', headers=headers)
print(response.text)
print(response.headers)
def get_status(usercode='101106120448', username='肖涛'):
data = {
's_kaohao': usercode,
's_xingming': username
}
response = session.post(
'https://411318.yichafen.com/public/checkcondition/sqcode/MsTcIn3mOTU1MnxkOGFiNDUzMWJjOGY3MjhiY2ZkN2FiZmQ0MmE0YzgxOXw0MTEzMTgO0O0O.html',
headers=headers, data=data)
print(response.text)
def main():
get_cookies()
get_status()
get_score()
if __name__ == '__main__':
main()
```
## 接着说说我的分析过程
* 请求分为三步,第一步是拿到cookie,第二步提交用户名和考号会得到一个返回结果,如下
<pre>{"info":"\u67e5\u8be2\u6210\u529f","status":1,"url":"\/public\/queryresult.html"}</pre>
* 显示请求成功,但是还要进行第三步,第三部必须带上referer,否者不返回结果
* 最重要的是访问必须携带cookie而且要在同一个session中,否则不返回数据,所以代码中第一部是请求cookies,用session自动保存cookies,避免了cookie的管理 session = requests.session()
session就是保持会话,帮你处理cookies的,没需要取出来cookies,
# encoding:utf-8
import requests
session = requests.session()
url='https://411318.yichafen.com/public/checkcondition/sqcode/MsTcIn3mOTU1MnxkOGFiNDUzMWJjOGY3MjhiY2ZkN2FiZmQ0MmE0YzgxOXw0MTEzMTgO0O0O.html'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36',
'Referer': 'https://411318.yichafen.com/public/queryscore/sqcode/MsTcIn3mOTU1MnxkOGFiNDUzMWJjOGY3MjhiY2ZkN2FiZmQ0MmE0YzgxOXw0MTEzMTgO0O0O.html',
}
data = {
's_kaohao': 101106120448,
's_xingming': '肖涛'
}
response = session.get(url='https://411318.yichafen.com', headers=headers)
r=session.post(url,headers=headers,data=data)
res=session.get(url='https://411318.yichafen.com/public/queryresult.html',headers=headers)
print(res.text)
本帖最后由 wuwangwo19 于 2021-8-9 11:01 编辑
楼主和4楼的代码都能正常运行,找到数据。感谢两位。 不错,继续努力 加油 保持连接状态还真是阔以,平时都是按需请求 万一请求的多次;让输入验证码的时候咋办 cry323 发表于 2021-1-28 12:27
万一请求的多次;让输入验证码的时候咋办
ocr识别,muggle ocr了解一下 谢谢楼主 很简便 学到了 兄嘚~ 个人信息貌似没有脱敏 使用session这个启发了我,以后不提取cookies了,感谢你。
不过,我也说说我的一点考虑:
Referer:告诉服务器他是从哪个网页的链接过来的。三次请求都是用同一个'Referer, 其实与理不通。
这个帖子很受启发。刚学Python但运行后发现无法读取到成绩。@frankyxu
页:
[1]
2