hahawangzi 发表于 2020-4-16 16:10

Python 问题 在爬去某漫画网站时发现 图片地址是加密的

#_*_ coding="utf-8" _*_
import requests,re
import os,sys,time
import json
from bs4 import BeautifulSoup
#---------------------------------------
def down(html:str):
   
    rr2 = requests.get(url2+html,headers=headers)
    soup2 =BeautifulSoup(rr2.text,'html.parser')
    img = soup2.find_all('img',src=re.compile('http://manhua1001'))
    print(img)


#---------------------------------------

url='http://www.dm5.com/manhua-piaoliujiaoshi/'
url2='http://www.dm5.com'
headers={
         'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'

            }
r = requests.get(url,headers=headers)
soup = BeautifulSoup(r.text,'html.parser')
lists=soup.find('ul',class_="view-win-list detail-list-select")
dict={}
print(soup.find(class_="title").getText())
for i in lists.find_all('li'):
    dict={
         "章节":i.find('a',href=re.compile('^/m11')).getText(),
         "地址":url2+str(i.find('a',href=re.compile('^/m11')).get('href'))
         

      }
    print(dict)
    down(dict["地址"])


   
http://manhua1001-61-174-50-99.cdndm5.com/specials/p/piaoliujiaoshi/0219044646_11102.jpg?cid=11076&key=70376878f1225d89ce251097b5ffeee1&uk=
爬出来的结果 漫画地址是加密的 只能手动打开网页另存为,这有什么办法解密码?

zhurui 发表于 2020-4-16 16:43

访问的图片Get需要带上Key

有文化的流氓 发表于 2020-4-16 16:54

看截图,访问需要加上Referer,懂了吗

hahawangzi 发表于 2020-4-16 16:58

不明白,代码上应该怎么操作,因为是超级新手新手新手

hahawangzi 发表于 2020-4-16 17:00

有文化的流氓 发表于 2020-4-16 16:54
看截图,访问需要加上Referer,懂了吗

我不明白,奥特曼老师,直接代码 告诉我好吗?

有文化的流氓 发表于 2020-4-16 17:03

就是访问图片时需要加上header头的Referer参数,这都不懂的话你要去了解下http协议

hucxixi 发表于 2020-4-16 17:18

zhurui 发表于 2020-4-16 16:43
访问的图片Get需要带上Key

他这种我估计域名都可以授权的。就是指定域名才可以访问图片

fa00x 发表于 2020-4-16 17:21

headers={
         'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'
         ‘Referer’:‘www.xxxxxx.com’
}
            
大概这个意思。我也新手

rsnodame 发表于 2020-4-16 17:24

hahawangzi 发表于 2020-4-16 17:00
我不明白,奥特曼老师,直接代码 告诉我好吗?

告诉你代码也没用,因为这些都是最基本的反爬手段,如果连这个都需要其他人帮忙分析的话等于是别人帮你写代码了。
建议你还是先看看网上的教程或者实例
https://cuiqingcai.com/1052.html

如果觉得教程太枯燥,可以看看实例,学一下别人是怎么分析的
https://cuiqingcai.com/990.html

毛阿毛 发表于 2020-4-16 17:55

他好像要的是动漫图片的具体路径。。网页上JS加密了。不能直接获取图片地址。。这个就要自己研究JS代码了。。看具体地址怎么算出来的。。
页: [1] 2
查看完整版本: Python 问题 在爬去某漫画网站时发现 图片地址是加密的