禁之零零 发表于 2023-2-16 11:50

Alist网盘遍历文件并调用Aria2的API进行批量下载并按目录结构保存

本帖最后由 禁之零零 于 2023-2-27 16:03 编辑


import requests
from urllib import parse
import json
from Aria2_RPC import Aria2Download
import time


class AlistDownload:
    def __init__(self, url):
      self.headers = {
            "Accept": "application/json, text/plain, */*",
            "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0.0.0 Safari/537.36",
            "Content-Type": "application/json;charset=UTF-8",
            "Accept-Encoding": "gzip, deflate",
            "Accept-Language": "zh-CN,zh;q=0.9"
      }

      parseresult = parse.urlparse(url)
      scheme = parseresult.scheme
      netloc = parseresult.netloc
      path = parse.unquote(parseresult.path)

      self.host = f"{scheme}://{netloc}"
      self.aria2 = Aria2Download()
      self.get_list(path)
      print("遍历完成")

    def post(self, url, data) -> (bool, dict):
      req_json = {}
      error_number = 0
      while True:
            status_code = 0
            try:
                req = requests.post(url=url, data=json.dumps(data), headers=self.headers, timeout=15)
                status_code = req.status_code
                req_json = req.json()
                req.close()
            except:
                pass

            if status_code == 200:
                break
            elif error_number > 2:
                break
            else:
                error_number += 1
                time.sleep(1)

      if status_code == 200:
            return True, req_json
      else:
            return False, req_json

    def get_list(self, path):
      url = self.host + "/api/fs/list"
      data = {"path": path, "password": "", "page": 1, "per_page": 0, "refresh": False}
      file_list = []
      error_number = 0
      while True:
            req_type, req_json = self.post(url=url, data=data)
            if req_type is False:
                return
            elif req_json.get("code") == 200:
                break
            elif error_number > 2:
                break
            else:
                print(req_json)
                error_number += 1
                time.sleep(2)
      if req_json.get("data") is None:
            return
      content = req_json.get("data")["content"]
      if content is None:
            return
      for file_info in content:
            if file_info["is_dir"] is True:
                file_download_url = path + "/" + file_info["name"]
                print("dir", file_download_url)
                file_list.append({"is_dir": True, "path": file_download_url})
            else:
                file_download_url = self.host + "/d" + path + "/" + file_info["name"]
                print("file", file_download_url)
                sign = file_info.get("sign")
                if sign is not None:
                  file_download_url = file_download_url + "?sign=" + sign
                file_list.append(
                  {"is_dir": False, "url": file_download_url, "path": path, "file": file_info["name"]})

      for file in file_list:
            if file["is_dir"] is True:
                self.get_list(file["path"])
            else:
                # D:\download 文件下载的存储地址
                self.aria2.addUri(file["url"], r"D:\download" + file["path"], file["file"])
                pass


if __name__ == '__main__':
    AlistDownload(
      "http://此处填入Alist网盘的地址")



Aria2的API详见这里:基于Aria2的API接口进行批量下载源码

wubit 发表于 2023-2-25 08:58

又有新问题了.只能下载一部分文件.报错以后就直接退出了.没有错误处理的代码.
dir /01小雅/教育/60T的知识仓库/✍🏻️教育楼【30.07T】/🖋️ 高中专区【2.28TB】/【高中竞赛资料】- new!(新增)【12.64GB】/高中生物竞赛【4.05GB】
dir /01小雅/教育/60T的知识仓库/✍🏻️教育楼【30.07T】/🖋️ 高中专区【2.28TB】/【高中竞赛资料】- new!(新增)【12.64GB】/高中化学竞赛【2.03GB】
dir /01小雅/教育/60T的知识仓库/✍🏻️教育楼【30.07T】/🖋️ 高中专区【2.28TB】/【高中竞赛资料】- new!(新增)【12.64GB】/高中竞赛联赛考前辅导【342.75MB】
Traceback (most recent call last):
File "D:\天翼云盘同步盘\new\alist.py", line 78, in <module>
    AlistDownload("http://wubit.cn:5244/01%E5%B0%8F%E9%9B%85/%E6%95%99%E8%82%B2/60T%E7%9A%84%E7%9F%A5%E8%AF%86%E4%BB%93%E5%BA%93/%E2%9C%8D%F0%9F%8F%BB%EF%B8%8F%E6%95%99%E8%82%B2%E6%A5%BC%E3%80%9030.07T%E3%80%91/%F0%9F%96%8B%EF%B8%8F%20%E9%AB%98%E4%B8%AD%E4%B8%93%E5%8C%BA%E3%80%902.28TB%E3%80%91")
File "D:\天翼云盘同步盘\new\alist.py", line 32, in __init__
    self.get_list(path)
File "D:\天翼云盘同步盘\new\alist.py", line 70, in get_list
    self.get_list(file["path"])
File "D:\天翼云盘同步盘\new\alist.py", line 70, in get_list
    self.get_list(file["path"])
File "D:\天翼云盘同步盘\new\alist.py", line 45, in get_list
    content = req_json.get("data")["content"]
TypeError: 'NoneType' object is not subscriptable

禁之零零 发表于 2023-2-23 15:41

wubit 发表于 2023-2-23 14:57
已经应用.下载列表里面都有文件了.也下载了东西.但是里面只有报错
{"code":401,"message":"expire missing ...
看了下是新版的Alist下载文件的GET请求中带有一sign参数,我之前要下载的那个Alist应该是个旧版本不需要这个,只需要在49~50行这两行代码中加入代码即可解决:
                        sign = file_info.get("sign")
                        if sign is not None:
                            file_download_url = file_download_url + "?sign=" + sign

ysjd22 发表于 2023-2-16 19:54

非常感谢。。。

hetiwz 发表于 2023-2-18 15:35

感谢~非常棒

lzj1995 发表于 2023-2-18 18:46

大佬能不能写一下脚本可以批量提取出 alist对应文件名和下载直连,最好可以生成一个表格

禁之零零 发表于 2023-2-20 10:12

lzj1995 发表于 2023-2-18 18:46
大佬能不能写一下脚本可以批量提取出 alist对应文件名和下载直连,最好可以生成一个表格

改一下61行的代码,把file["url"]和file["file"]保存在表格中就能实现你的要求了

心伤的天堂 发表于 2023-2-20 10:52

请教一下,这个模块怎么安装呢
ModuleNotFoundError: No module named 'Aria2_RPC'

我找了一下,没找到

禁之零零 发表于 2023-2-20 13:57

心伤的天堂 发表于 2023-2-20 10:52
请教一下,这个模块怎么安装呢
ModuleNotFoundError: No module named 'Aria2_RPC'



你没有仔细看到帖子的末尾,这个模块在宁外一个帖子中给予Aria2的API接口进行批量下载源码

心伤的天堂 发表于 2023-2-20 18:32

禁之零零 发表于 2023-2-20 13:57
你没有仔细看到帖子的末尾,这个模块在宁外一个帖子中给予Aria2的API接口进行批量下载源码

懂了 懂了 感谢分享

wubit 发表于 2023-2-23 14:43

下载回来是一个接口报错的1K文件

禁之零零 发表于 2023-2-23 14:47

wubit 发表于 2023-2-23 14:43
下载回来是一个接口报错的1K文件

看帖子的末尾,有说明引用的外部模块Aria2_PRC在哪
页: [1] 2 3
查看完整版本: Alist网盘遍历文件并调用Aria2的API进行批量下载并按目录结构保存