Python 问题在爬去某漫画网站时发现图片地址是加密的

hahawangzi 发表于 2020-4-16 16:10

#_*_ coding="utf-8" _*_
import requests,re
import os,sys,time
import json
from bs4 import BeautifulSoup
#---------------------------------------
def down(html:str):

rr2 = requests.get(url2+html,headers=headers)
soup2 =BeautifulSoup(rr2.text,'html.parser')
img = soup2.find_all('img',src=re.compile('http://manhua1001'))
print(img)

#---------------------------------------

url='http://www.dm5.com/manhua-piaoliujiaoshi/'
url2='http://www.dm5.com'
headers={
      'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'

         }
r = requests.get(url,headers=headers)
soup = BeautifulSoup(r.text,'html.parser')
lists=soup.find('ul',class_="view-win-list detail-list-select")
dict={}
print(soup.find(class_="title").getText())
for i in lists.find_all('li'):
dict={
      "章节":i.find('a',href=re.compile('^/m11')).getText(),
      "地址":url2+str(i.find('a',href=re.compile('^/m11')).get('href'))


   }
print(dict)
down(dict["地址"])

http://manhua1001-61-174-50-99.cdndm5.com/specials/p/piaoliujiaoshi/0219044646_11102.jpg?cid=11076&key=70376878f1225d89ce251097b5ffeee1&uk=
爬出来的结果漫画地址是加密的只能手动打开网页另存为，这有什么办法解密码？

zhurui 发表于 2020-4-16 16:43

访问的图片Get需要带上Key

有文化的流氓 发表于 2020-4-16 16:54

看截图，访问需要加上Referer，懂了吗

hahawangzi 发表于 2020-4-16 16:58

不明白，代码上应该怎么操作，因为是超级新手新手新手

hahawangzi 发表于 2020-4-16 17:00

有文化的流氓发表于 2020-4-16 16:54
看截图，访问需要加上Referer，懂了吗

我不明白，奥特曼老师，直接代码告诉我好吗？

有文化的流氓 发表于 2020-4-16 17:03

就是访问图片时需要加上header头的Referer参数，这都不懂的话你要去了解下http协议

hucxixi 发表于 2020-4-16 17:18

zhurui 发表于 2020-4-16 16:43
访问的图片Get需要带上Key

他这种我估计域名都可以授权的。就是指定域名才可以访问图片

fa00x 发表于 2020-4-16 17:21

headers={
      'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'
      ‘Referer’：‘www.xxxxxx.com’
}

大概这个意思。我也新手

rsnodame 发表于 2020-4-16 17:24

hahawangzi 发表于 2020-4-16 17:00
我不明白，奥特曼老师，直接代码告诉我好吗？

告诉你代码也没用，因为这些都是最基本的反爬手段，如果连这个都需要其他人帮忙分析的话等于是别人帮你写代码了。
建议你还是先看看网上的教程或者实例
https://cuiqingcai.com/1052.html

如果觉得教程太枯燥，可以看看实例，学一下别人是怎么分析的
https://cuiqingcai.com/990.html

毛阿毛 发表于 2020-4-16 17:55

他好像要的是动漫图片的具体路径。。网页上JS加密了。不能直接获取图片地址。。这个就要自己研究JS代码了。。看具体地址怎么算出来的。。

页: [1] 2

吾爱破解 - 52pojie.cn's Archiver

Python 问题 在爬去某漫画网站时发现 图片地址是加密的

Python 问题在爬去某漫画网站时发现图片地址是加密的