Alist网盘遍历文件并调用Aria2的API进行批量下载并按目录结构保存

禁之零零 发表于 2023-2-16 11:50

本帖最后由禁之零零于 2023-2-27 16:03 编辑

import requests
from urllib import parse
import json
from Aria2_RPC import Aria2Download
import time

class AlistDownload:
def __init__(self, url):
   self.headers = {
         "Accept": "application/json, text/plain, */*",
         "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0.0.0 Safari/537.36",
         "Content-Type": "application/json;charset=UTF-8",
         "Accept-Encoding": "gzip, deflate",
         "Accept-Language": "zh-CN,zh;q=0.9"
   }

   parseresult = parse.urlparse(url)
   scheme = parseresult.scheme
   netloc = parseresult.netloc
   path = parse.unquote(parseresult.path)

   self.host = f"{scheme}://{netloc}"
   self.aria2 = Aria2Download()
   self.get_list(path)
   print("遍历完成")

def post(self, url, data) -> (bool, dict):
   req_json = {}
   error_number = 0
   while True:
         status_code = 0
         try:
            req = requests.post(url=url, data=json.dumps(data), headers=self.headers, timeout=15)
            status_code = req.status_code
            req_json = req.json()
            req.close()
         except:
            pass

         if status_code == 200:
            break
         elif error_number > 2:
            break
         else:
            error_number += 1
            time.sleep(1)

   if status_code == 200:
         return True, req_json
   else:
         return False, req_json

def get_list(self, path):
   url = self.host + "/api/fs/list"
   data = {"path": path, "password": "", "page": 1, "per_page": 0, "refresh": False}
   file_list = []
   error_number = 0
   while True:
         req_type, req_json = self.post(url=url, data=data)
         if req_type is False:
            return
         elif req_json.get("code") == 200:
            break
         elif error_number > 2:
            break
         else:
            print(req_json)
            error_number += 1
            time.sleep(2)
   if req_json.get("data") is None:
         return
   content = req_json.get("data")["content"]
   if content is None:
         return
   for file_info in content:
         if file_info["is_dir"] is True:
            file_download_url = path + "/" + file_info["name"]
            print("dir", file_download_url)
            file_list.append({"is_dir": True, "path": file_download_url})
         else:
            file_download_url = self.host + "/d" + path + "/" + file_info["name"]
            print("file", file_download_url)
            sign = file_info.get("sign")
            if sign is not None:
               file_download_url = file_download_url + "?sign=" + sign
            file_list.append(
               {"is_dir": False, "url": file_download_url, "path": path, "file": file_info["name"]})

   for file in file_list:
         if file["is_dir"] is True:
            self.get_list(file["path"])
         else:
            # D:\download 文件下载的存储地址
            self.aria2.addUri(file["url"], r"D:\download" + file["path"], file["file"])
            pass

if __name__ == '__main__':
AlistDownload(
   "http://此处填入Alist网盘的地址")

Aria2的API详见这里：基于Aria2的API接口进行批量下载源码

wubit 发表于 2023-2-25 08:58

又有新问题了.只能下载一部分文件.报错以后就直接退出了.没有错误处理的代码.
dir /01小雅/教育/60T的知识仓库/✍🏻️教育楼【30.07T】/🖋️ 高中专区【2.28TB】/【高中竞赛资料】- new!（新增）【12.64GB】/高中生物竞赛【4.05GB】
dir /01小雅/教育/60T的知识仓库/✍🏻️教育楼【30.07T】/🖋️ 高中专区【2.28TB】/【高中竞赛资料】- new!（新增）【12.64GB】/高中化学竞赛【2.03GB】
dir /01小雅/教育/60T的知识仓库/✍🏻️教育楼【30.07T】/🖋️ 高中专区【2.28TB】/【高中竞赛资料】- new!（新增）【12.64GB】/高中竞赛联赛考前辅导【342.75MB】
Traceback (most recent call last):
File "D:\天翼云盘同步盘\new\alist.py", line 78, in <module>
AlistDownload("http://wubit.cn:5244/01%E5%B0%8F%E9%9B%85/%E6%95%99%E8%82%B2/60T%E7%9A%84%E7%9F%A5%E8%AF%86%E4%BB%93%E5%BA%93/%E2%9C%8D%F0%9F%8F%BB%EF%B8%8F%E6%95%99%E8%82%B2%E6%A5%BC%E3%80%9030.07T%E3%80%91/%F0%9F%96%8B%EF%B8%8F%20%E9%AB%98%E4%B8%AD%E4%B8%93%E5%8C%BA%E3%80%902.28TB%E3%80%91")
File "D:\天翼云盘同步盘\new\alist.py", line 32, in __init__
self.get_list(path)
File "D:\天翼云盘同步盘\new\alist.py", line 70, in get_list
self.get_list(file["path"])
File "D:\天翼云盘同步盘\new\alist.py", line 70, in get_list
self.get_list(file["path"])
File "D:\天翼云盘同步盘\new\alist.py", line 45, in get_list
content = req_json.get("data")["content"]
TypeError: 'NoneType' object is not subscriptable

禁之零零 发表于 2023-2-23 15:41

wubit 发表于 2023-2-23 14:57
已经应用.下载列表里面都有文件了.也下载了东西.但是里面只有报错
{"code":401,"message":"expire missing ...
看了下是新版的Alist下载文件的GET请求中带有一sign参数，我之前要下载的那个Alist应该是个旧版本不需要这个，只需要在49~50行这两行代码中加入代码即可解决：
                     sign = file_info.get("sign")
                     if sign is not None:
                        file_download_url = file_download_url + "?sign=" + sign

ysjd22 发表于 2023-2-16 19:54

非常感谢。。。

hetiwz 发表于 2023-2-18 15:35

感谢~非常棒

lzj1995 发表于 2023-2-18 18:46

大佬能不能写一下脚本可以批量提取出 alist对应文件名和下载直连，最好可以生成一个表格

禁之零零 发表于 2023-2-20 10:12

lzj1995 发表于 2023-2-18 18:46
大佬能不能写一下脚本可以批量提取出 alist对应文件名和下载直连，最好可以生成一个表格

改一下61行的代码，把file["url"]和file["file"]保存在表格中就能实现你的要求了

心伤的天堂 发表于 2023-2-20 10:52

请教一下，这个模块怎么安装呢
ModuleNotFoundError: No module named 'Aria2_RPC'

我找了一下，没找到

禁之零零 发表于 2023-2-20 13:57

心伤的天堂发表于 2023-2-20 10:52
请教一下，这个模块怎么安装呢
ModuleNotFoundError: No module named 'Aria2_RPC'

你没有仔细看到帖子的末尾，这个模块在宁外一个帖子中给予Aria2的API接口进行批量下载源码

心伤的天堂 发表于 2023-2-20 18:32

禁之零零发表于 2023-2-20 13:57
你没有仔细看到帖子的末尾，这个模块在宁外一个帖子中给予Aria2的API接口进行批量下载源码

懂了懂了感谢分享

wubit 发表于 2023-2-23 14:43

下载回来是一个接口报错的1K文件

禁之零零 发表于 2023-2-23 14:47

wubit 发表于 2023-2-23 14:43
下载回来是一个接口报错的1K文件

看帖子的末尾，有说明引用的外部模块Aria2_PRC在哪

页: [1] 2 3

吾爱破解 - 52pojie.cn's Archiver

Alist网盘遍历文件并调用Aria2的API进行批量下载并按目录结构保存