本帖最后由 kognzhezhi 于 2023-10-16 09:20 编辑
问题:最近在练习python,在爬取某一页信息时需要设置cookie,但是每次都是手动输入的,感觉很麻烦,然后想到让程序自己提取cookie 再使用。但是提取的cookie 不能使用(提取的cookie爬取不到信息,自己从网页复制的就可以)
麻烦大家帮我看一下 哪里出了问题,下面是提取cookie的代码
[Python] 纯文本查看 复制代码 url_search = ''
res = requests.get(url_search)
cookiejar = res.cookies
cookie = requests.utils.dict_from_cookiejar(cookiejar)
这是网页复制的cookie 'JSESSIONID=77296348A2CEF825BE2CC44D94E98883; uvid=1881565932_1691460962_67; Hm_lvt_a8fda29303267d5a0517d9573ac30d91=1691460963; HWWAFSESID=f9dd19d0384152e98f; HWWAFSESTIME=1697333366569'
这是爬取的cookie '{'HWWAFSESID': '88ffb7fce2f66ca27b', 'HWWAFSESTIME': '1697334176861', 'JSESSIONID': 'EB96A9AC5F3A12EA14681D237667926D'}'
我也试着把他们格式弄得一样 还是不能用,请教哪里有问题
今天又换了个电脑试了试
这是网页上的cookie
Cookie:
JSESSIONID=D1AF9DD6BE0F1B0FFEC22FDCACD4C60C; HWWAFSESID=74a559a6522d02930b; HWWAFSESTIME=1697416537740
[Python] 纯文本查看 复制代码 web = Edge()
web.get('http://www.xunbao178.com/wmgj/')
cookies=web.get_cookies()
time.sleep(3)
cookie = [item["name"] + "=" + item["value"] for item in cookies]
cookiestr = '; '.join(item for item in cookie)
print(cookiestr)
url = 'http://www.xunbao178.com/wmgj/buyDetail.gsp?commid=21330854&page=1&group0=%E8%A7%92%E8%89%B2&keyWord=&orderBy=default'
headers = {
'cookie': cookiestr,
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.181 Safari/537.36'
}
html = requests.get(url=url, headers=headers)
print(html.text)
这是请求cookie的代码
这是请求获得的cookie 'HWWAFSESTIME=1697419139745; HWWAFSESID=c525694eb42d7cbe58; JSESSIONID=4959C8D1C2A210A7343D8C01C1F4E3DE'
请求的cookie 就是和网页的顺序不大一样,其实调换顺序和网页上复制的一样 也是不能获得页面数据
大佬们在帮忙看一下 |