吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2020|回复: 10
收起左侧

[已解决] python 关于蓝奏云直链的提取求助

[复制链接]
Glenn 发表于 2021-8-30 15:13
本帖最后由 Glenn 于 2021-8-30 16:22 编辑

import requests
from bs4 import BeautifulSoup


url = "https://wwa.lanzoui.com/iHj0urx1b7e"

session = requests.Session()
session.headers["User-Agent"] = "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36"

headers = {
    "accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9",
    "accept-encoding": "gzip, deflate, br",
    "accept-language": "zh-CN,zh;q=0.9",
    "sec-fetch-dest": "document",
    "sec-fetch-mode": "navigate",
    "sec-fetch-site": "none",
    "upgrade-insecure-requests": "1",
}

res1 = session.get(url=url, headers=headers)
soup = BeautifulSoup(res1.text, 'html.parser')
print(requests.utils.dict_from_cookiejar(session.cookies))  # 打印当前的cookie
url2 = 'https://www.lanzous.com' + soup.find('iframe')['src']

headers = {
    "Host": "wwa.lanzoui.com",
    "Connection": "keep-alive",
    "Upgrade-Insecure-Requests": "1",
    "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9",
    "Sec-Fetch-Site": "same-origin",
    "Sec-Fetch-Mode": "navigate",
    "Sec-Fetch-Dest": "iframe",
    "Referer": url,
    "Accept-Encoding": "gzip, deflate, br",
    "Accept-Language": "zh-CN,zh;q=0.9"
}

res2 = session.get(url2, headers=headers
)   # 执行到这出错
print(res2.text)

# 执行到第二个请求的时候出错,感觉是Cookie的问题,请问有解决方法吗?

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

平淡最真 发表于 2021-8-30 15:20
复制粘贴运行了下没有报错
 楼主| Glenn 发表于 2021-8-30 15:23
本帖最后由 Glenn 于 2021-8-30 15:29 编辑
平淡最真 发表于 2021-8-30 15:20
复制粘贴运行了下没有报错

不会吧。。。我报错
requests.exceptions.ConnectionError: HTTPSConnectionPool(host='www.lanzous.com', port=443): Max retries exceeded with url: /fn?A2VQOl43BmoJaVA3AGxVYVEzBDVSK1YgAjgHMABqUWNSYgdjD2IEaAJjA2ECZ116AC1SMlNuB3ZXOVQ1ATNVPwNmUH5ePgYeCTVQTgAT (Caused by NewConnectionError('<urllib3.connection.HTTPSConnection object at 0x0000000003678C40>: Failed to establish a new connection: [Errno 11004] getaddrinfo failed'))

第一步请求后打印出的cookie  我只有 {'codelen': '1', 'pc_ad1': '1'}
平淡最真 发表于 2021-8-30 15:29
Glenn 发表于 2021-8-30 15:23
不会吧。。。我报错
requests.exceptions.ConnectionError: HTTPSConnectionPool(host='www.lanzous.co ...

{'codelen': '1', 'pc_ad1': '1'}
https://www.lanzouj.com/fn?A2UHb ... QNmBylePlNLAT0LFQYV

进程已结束,退出代码为 0
 楼主| Glenn 发表于 2021-8-30 15:36
平淡最真 发表于 2021-8-30 15:29
{'codelen': '1', 'pc_ad1': '1'}
https://www.lanzouj.com/fn?A2UHbV43Uz8BYQtsBmpSZgBiBTRWLwJ0ADpbbF ...

您的python  与 requests 的版本能告知一下吗
平淡最真 发表于 2021-8-30 15:37
Glenn 发表于 2021-8-30 15:36
您的python  与 requests 的版本能告知一下吗

2.26.0                    3.9.6
 楼主| Glenn 发表于 2021-8-30 15:43
平淡最真 发表于 2021-8-30 15:37
2.26.0                    3.9.6

您第一个请求打印出的Cookie是什么样的?
平淡最真 发表于 2021-8-30 15:47
Glenn 发表于 2021-8-30 15:43
您第一个请求打印出的Cookie是什么样的?

上面已经发了{'codelen': '1', 'pc_ad1': '1'}
 楼主| Glenn 发表于 2021-8-30 15:59
平淡最真 发表于 2021-8-30 15:47
上面已经发了{'codelen': '1', 'pc_ad1': '1'}

最后 加上个 print(res2.text)  看看打印出的是什么内容
平淡最真 发表于 2021-8-30 16:08
Glenn 发表于 2021-8-30 15:59
最后 加上个 print(res2.text)  看看打印出的是什么内容

不好意思,我复制的时候后面一段没复制进去。
只运行了res1,res2一样报错的
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 22:44

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表