python 关于蓝奏云直链的提取求助
本帖最后由 Glenn 于 2021-8-30 16:22 编辑import requests
from bs4 import BeautifulSoup
url = "https://wwa.lanzoui.com/iHj0urx1b7e"
session = requests.Session()
session.headers["User-Agent"] = "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36"
headers = {
"accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9",
"accept-encoding": "gzip, deflate, br",
"accept-language": "zh-CN,zh;q=0.9",
"sec-fetch-dest": "document",
"sec-fetch-mode": "navigate",
"sec-fetch-site": "none",
"upgrade-insecure-requests": "1",
}
res1 = session.get(url=url, headers=headers)
soup = BeautifulSoup(res1.text, 'html.parser')
print(requests.utils.dict_from_cookiejar(session.cookies))# 打印当前的cookie
url2 = 'https://www.lanzous.com' + soup.find('iframe')['src']
headers = {
"Host": "wwa.lanzoui.com",
"Connection": "keep-alive",
"Upgrade-Insecure-Requests": "1",
"Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9",
"Sec-Fetch-Site": "same-origin",
"Sec-Fetch-Mode": "navigate",
"Sec-Fetch-Dest": "iframe",
"Referer": url,
"Accept-Encoding": "gzip, deflate, br",
"Accept-Language": "zh-CN,zh;q=0.9"
}
res2 = session.get(url2, headers=headers) # 执行到这出错
print(res2.text)
# 执行到第二个请求的时候出错,感觉是Cookie的问题,请问有解决方法吗?
复制粘贴运行了下没有报错 本帖最后由 Glenn 于 2021-8-30 15:29 编辑
平淡最真 发表于 2021-8-30 15:20
复制粘贴运行了下没有报错
不会吧。。。我报错
requests.exceptions.ConnectionError: HTTPSConnectionPool(host='www.lanzous.com', port=443): Max retries exceeded with url: /fn?A2VQOl43BmoJaVA3AGxVYVEzBDVSK1YgAjgHMABqUWNSYgdjD2IEaAJjA2ECZ116AC1SMlNuB3ZXOVQ1ATNVPwNmUH5ePgYeCTVQTgAT (Caused by NewConnectionError('<urllib3.connection.HTTPSConnection object at 0x0000000003678C40>: Failed to establish a new connection: getaddrinfo failed'))
第一步请求后打印出的cookie我只有 {'codelen': '1', 'pc_ad1': '1'} Glenn 发表于 2021-8-30 15:23
不会吧。。。我报错
requests.exceptions.ConnectionError: HTTPSConnectionPool(host='www.lanzous.co ...
{'codelen': '1', 'pc_ad1': '1'}
https://www.lanzouj.com/fn?A2UHbV43Uz8BYQtsBmpSZgBiBTRWLwJ0ADpbbFc9UWNTY1QwXjMOY1QyVjVWOlN0U35QMFRpBndXOQBhBjRTOQNmBylePlNLAT0LFQYV
进程已结束,退出代码为 0 平淡最真 发表于 2021-8-30 15:29
{'codelen': '1', 'pc_ad1': '1'}
https://www.lanzouj.com/fn?A2UHbV43Uz8BYQtsBmpSZgBiBTRWLwJ0ADpbbF ...
您的python与 requests 的版本能告知一下吗 Glenn 发表于 2021-8-30 15:36
您的python与 requests 的版本能告知一下吗
2.26.0 3.9.6 平淡最真 发表于 2021-8-30 15:37
2.26.0 3.9.6
您第一个请求打印出的Cookie是什么样的? Glenn 发表于 2021-8-30 15:43
您第一个请求打印出的Cookie是什么样的?
上面已经发了{'codelen': '1', 'pc_ad1': '1'}
平淡最真 发表于 2021-8-30 15:47
上面已经发了{'codelen': '1', 'pc_ad1': '1'}
最后 加上个 print(res2.text)看看打印出的是什么内容 Glenn 发表于 2021-8-30 15:59
最后 加上个 print(res2.text)看看打印出的是什么内容
不好意思,我复制的时候后面一段没复制进去。
只运行了res1,res2一样报错的{:1_908:}
页:
[1]
2