批量读取excel百度链接转存到自己的百度网盘
本帖最后由 香谢枫林 于 2019-12-27 22:28 编辑最近遇到一批百度链接,想要转存到自己的网盘里,于是写了一个脚本,共享给大家。
PS:附件里有脚本代码......以及300多套图链接。
语言:Python3
功能:批量读取excel百度链接转存到自己的百度网盘指定目录
第一步:获取自己百度网盘的BDUSS,STOKEN,bdstoken这三个数据,方法:登录百度网盘,通过浏览器开发者模式获取这些信息,参考如下
第二步:把参数填入代码主程序,调试执行代码即可。
#!/usr/local/Cellar/python/3.7.1/bin
# -*- coding: UTF-8 -*-
import requests,re,time,random,os,xlrd
path = os.getcwd()
#获取当前时间戳
def get_timestamp():
return int(round(time.time() * 1000)/1e3)
#百度分享文件转存
def bdsave(furl,verify,savepath,BDUSS,STOKEN,bdstoken):
#Get 打开分享链接网址
s = requests.Session()
s.cookies['BDUSS'] = BDUSS
s.cookies['STOKEN'] = STOKEN
surl = furl.split('/')[-1])]
headers = {
'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.79 Safari/537.36',
'Referer': 'https://pan.baidu.com/share/init?surl=' + surl
}
req = s.get(furl, headers=headers)
req.encoding = 'utf-8'
#判断分享链接是否正常
if ('侵权、色情、反动、低俗' in req.text) or ('已过期' in req.text):
print('此链接分享内容可能因为涉及侵权、色情、反动、低俗等信息,无法访问!||啊哦,来晚了,该分享文件已过期!')
return ('此链接分享内容可能因为涉及侵权、色情、反动、低俗等信息,无法访问!||啊哦,来晚了,该分享文件已过期!')
else:
# Post user信息
purl = 'https://pan.baidu.com/api/report/user?channel=chunlei&web=1&app_id=250528&bdstoken=' + bdstoken + \
'&logid=MTU3NjY0ODUzNTI1MjAuNjkzMzEyMTcyODA2ODk2&clienttype=0'
data = {'timestamp': get_timestamp(), 'action': 'web_home'}
req = s.post(purl, data=data, headers=headers)
# Post 链接和提取码信息,获取分享的内容
purl = 'https://pan.baidu.com/share/verify?surl=' + surl + '&t=' + str(get_timestamp()) \
+ '&channel=chunlei&web=1&app_id=250528&bdstoken=' + bdstoken + '&logid=MTU3NjY1MDc0NDMyMzAuMjIxNjQwMTA0OTQ3NjA0Njc=&clienttype=0'
data = {'pwd': verify, 'vcode': '', 'vcode_str': ''}
req = s.post(purl, data=data, headers=headers)
rinfo = re.findall('"errno":[-]{0,1}\d+', req.text).replace('"errno":', '')
if rinfo in '-12,-9':
return ('提取码错误。')
else:
# Get 获取保存分享内容需要使用的相关参数信息,这些写信息存在与分享链接网页里
req = s.get(furl, headers=headers)
req.encoding = 'utf-8'
shareid = re.findall('"shareid":\d+', req.text).replace('"shareid":', '')
uk = re.findall('uk=\d+', req.text).replace('uk=', '')
fsidlist = re.findall('"fs_id":\d+', req.text).replace('"fs_id":', '')
app_id = re.findall('"app_id":"\d+"', req.text).replace('"app_id":', '').replace('"', '')
# print('shareid:'+shareid +'\nuk:'+uk+'\nfsidlist:'+fsidlist+'\napp_id:'+app_id)
# Post 保存分享的内容
purl = 'https://pan.baidu.com/share/transfer?shareid=' + shareid + '&from=' + uk + '&channel=chunlei&web=1&app_id=' + app_id + '&bdstoken=' + bdstoken + '&logid=MTU3NjY1MTc1NTcwNTAuNjg1NDU2NDk2ODIxNjYx&clienttype=0'
data = {
'fsidlist': '[' + fsidlist + ']',
'path': '/' + savepath
}
req = s.post(purl, data=data, headers=headers)
req.encoding = 'utf-8'
#检查最后返回的页面信息,查看是否成功保存
try:
zcinfo = re.findall('\[\{"errno":[-]{0,1}\d+', req.text).replace('[{"errno":', '')
except:
return 'Cookies失效,请更新BDUSS、STOKEN、bdstoken后再试!'
else:
info = {
"0": "转存成功。",
"-1": "由于您分享了违反相关法律法规的文件,分享功能已被禁用,之前分享出去的文件不受影响。",
"-2": "用户不存在,请刷新页面后重试。",
"-3": "文件不存在,请刷新页面后重试。",
"-4": "登录信息有误,请重新登录试试。",
"-5": "host_key和user_key无效。",
"-6": "请重新登录。",
"-7": "该分享已删除或已取消。",
"-8": "该分享已经过期。",
"-9": "访问密码错误。",
"-10": "分享外链已经达到最大上限100000条,不能再次分享。",
"-11": "验证cookie无效。",
"-14": "对不起,短信分享每天限制20条,你今天已经分享完,请明天再来分享吧!",
"-15": "对不起,邮件分享每天限制20封,你今天已经分享完,请明天再来分享吧!",
"-16": "对不起,该文件已经限制分享!",
"-17": "文件分享超过限制。",
"-21": "预置文件无法进行相关操作。",
"-30": "文件已存在。",
"-31": "文件保存失败。",
"-33": "一次支持操作999个,减点试试吧。",
"-32": "未知结果。",
"-70": "你分享的文件中包含病毒或疑似病毒,为了你和他人的数据安全,换个文件分享吧。",
"2": "参数错误。",
"3": "未登录或帐号无效。",
"4": "存储好像出问题了,请稍候再试。",
"108": "文件名有敏感词,优化一下吧。",
"110": "分享次数超出限制,可以到“我的分享”中查看已分享的文件链接。",
"114": "当前任务不存在,保存失败。",
"115": "该文件禁止分享。",
"112": '页面已过期,请刷新后重试。',
"9100": '你的帐号存在违规行为,已被冻结。',
"9200": '你的帐号存在违规行为,已被冻结。',
"9300": '你的帐号存在违规行为,该功能暂被冻结。',
"9400": '你的帐号异常,需验证后才能使用该功能。',
"9500": '你的帐号存在安全风险,已进入保护模式,请修改密码后使用。'}
return (info)
# 从Excel中读取分享链接和提取密码(默认第一列是链接、第二列是提取密码)
def read_excel():
filePath = os.path.join(os.getcwd(), "PartyCat.xls")
workbook = xlrd.open_workbook(filePath)
sheet1 = workbook.sheet_by_index(0)
listurl = []
listpwd = []
rownum = sheet1.nrows
for row in range(rownum):
listurl.append(sheet1.cell_value(row, 0))
listpwd.append(sheet1.cell_value(row, 1))
return listurl,listpwd
def main():
# 百度网盘转存,注:BDUSS,STOKEN,bdstoken 参数要自己获取
# furl = 分享链接
# verify = 提取码
# savepath = 转存到百度网盘指定目录
# BDUSS = 从百度COOKICES中提取
# STOKEN = 从百度COOKICES中提取
# bdstoken = 从百度COOKICES中提取
savepath = '/临时文件/pic图片'
BDUSS = ''
STOKEN = ''
bdstoken = ''
listurl, listpwd = read_excel()
for index in range(len(listurl)):
time.sleep(random.randint(1, 5))
srcurl = listurl
srcpwd = listpwd
print('第'+str(index + 1)+'条: '+str(srcurl)+' '+str(srcpwd))
info = bdsave(srcurl, srcpwd, savepath, BDUSS, STOKEN, bdstoken)
print(info)
if __name__ == '__main__':
main()
执行效果如下:
执行后,百度网盘转存情况如下:
脚本代码打包如下(密码:52pojie):
注:百度网盘转存功能参考了论坛一位大神的帖子:https://www.52pojie.cn/thread-1005198-1-1.html 对于用得到的人就非常实用了,谢谢分享! 谢谢楼主了 楼楼主。我可发到github上吗? HighBox 发表于 2019-12-27 23:33
楼楼主。我可发到github上吗?
可以啊! python是个好东西,不过有点忘光了,得复习复习 如果能以软件的形式就好了 感谢分享 香谢枫林 发表于 2019-12-28 08:32
可以啊!
谢谢楼主 谢谢分享。
页:
[1]
2