Python 问题 在爬去某漫画网站时发现 图片地址是加密的
#_*_ coding="utf-8" _*_import requests,re
import os,sys,time
import json
from bs4 import BeautifulSoup
#---------------------------------------
def down(html:str):
rr2 = requests.get(url2+html,headers=headers)
soup2 =BeautifulSoup(rr2.text,'html.parser')
img = soup2.find_all('img',src=re.compile('http://manhua1001'))
print(img)
#---------------------------------------
url='http://www.dm5.com/manhua-piaoliujiaoshi/'
url2='http://www.dm5.com'
headers={
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'
}
r = requests.get(url,headers=headers)
soup = BeautifulSoup(r.text,'html.parser')
lists=soup.find('ul',class_="view-win-list detail-list-select")
dict={}
print(soup.find(class_="title").getText())
for i in lists.find_all('li'):
dict={
"章节":i.find('a',href=re.compile('^/m11')).getText(),
"地址":url2+str(i.find('a',href=re.compile('^/m11')).get('href'))
}
print(dict)
down(dict["地址"])
http://manhua1001-61-174-50-99.cdndm5.com/specials/p/piaoliujiaoshi/0219044646_11102.jpg?cid=11076&key=70376878f1225d89ce251097b5ffeee1&uk=
爬出来的结果 漫画地址是加密的 只能手动打开网页另存为,这有什么办法解密码? 访问的图片Get需要带上Key 看截图,访问需要加上Referer,懂了吗 不明白,代码上应该怎么操作,因为是超级新手新手新手 有文化的流氓 发表于 2020-4-16 16:54
看截图,访问需要加上Referer,懂了吗
我不明白,奥特曼老师,直接代码 告诉我好吗? 就是访问图片时需要加上header头的Referer参数,这都不懂的话你要去了解下http协议 zhurui 发表于 2020-4-16 16:43
访问的图片Get需要带上Key
他这种我估计域名都可以授权的。就是指定域名才可以访问图片 headers={
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'
‘Referer’:‘www.xxxxxx.com’
}
大概这个意思。我也新手 hahawangzi 发表于 2020-4-16 17:00
我不明白,奥特曼老师,直接代码 告诉我好吗?
告诉你代码也没用,因为这些都是最基本的反爬手段,如果连这个都需要其他人帮忙分析的话等于是别人帮你写代码了。
建议你还是先看看网上的教程或者实例
https://cuiqingcai.com/1052.html
如果觉得教程太枯燥,可以看看实例,学一下别人是怎么分析的
https://cuiqingcai.com/990.html 他好像要的是动漫图片的具体路径。。网页上JS加密了。不能直接获取图片地址。。这个就要自己研究JS代码了。。看具体地址怎么算出来的。。
页:
[1]
2