吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 3538|回复: 20
收起左侧

[Python 转载] 某办公网站高清摄影图片爬取

[复制链接]
zyhxhw 发表于 2022-1-9 23:11
import os
import requests
import re

def soushu(zzbds,html):
    ab = re.compile(zzbds, re.S)
    zml = re.findall(ab, html)
    return zml
def openwangye0(url):
    headers = {
        'cookie':'auth_token=VPu9LKcXvbqKjlosWxOLRM2aCWq4BrdF_VwKuWW64Yjb5tB4l-AHDlYhn59T6Cix0z9Xh1t4PtirXCbkp4vzNA',
    }
    htl = requests.get(url,headers=headers,timeout=10)   
    return htl
url = 'https://www.tukuppt.com/peitu/p199/'
html = openwangye0(url).text
zzbds = 'pid="(.*?)" issc="." isfrom="."></span>\r\n    <a href=".*?" target="_blank"><img title="(.*?)"'
pagetpml = soushu(zzbds,html)
print(len(pagetpml),pagetpml)
a = 0
for i in pagetpml[a:]:
    url = f'https://www.tukuppt.com/index/down?pid={i[0]}'
    html = openwangye0(url)
    data = html.text
    zzbds = '"downurl":"(.*?)"'
    downurl = soushu(zzbds,data)
    print(data)
    downurl1 = re.sub('\\\\','',downurl[0])   
    data = openwangye0(downurl1).content   
    path = r'D:\xmbgtp'
    if not os.path.exists(path):
        os.mkdir(path)
    filname = os.path.join(path,f'{i[1]}.jpg')
    with open(filname,'wb') as f:
        f.write(data)
    print(f'{i[1]}下载完成')

免费评分

参与人数 1吾爱币 +5 热心值 +1 收起 理由
苏紫方璇 + 5 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

正己 发表于 2022-1-9 23:39
zyhxhw 发表于 2022-1-9 23:18
很肤浅,也不完美。希望大佬指教。不完善的地方是网站做了下载次数的限制,一个cookie只能下载7张高清大图 ...

分析一下注册流程,批量注册获取token,然后再套用不同的token去下载
 楼主| zyhxhw 发表于 2022-1-10 22:49
kll545012 发表于 2022-1-10 10:35
一个账号一个token,多注册账号,拿到token,然后换headers里的token就行了

说的不错!正是这样,但是手机号总是有限的,这个token 肯定 是根据手机号生成的,如果能找到生成的办法,输入一串数字,就能生成是token,那是最简单的解决的办法。还有一个思路就是,网站是怎么记录上传次数的,如果提交的次数始终为0,不就可以永远下载了吗
 楼主| zyhxhw 发表于 2022-1-9 23:18
很肤浅,也不完美。希望大佬指教。不完善的地方是网站做了下载次数的限制,一个cookie只能下载7张高清大图。如有大佬能突破限制,望不吝赐教!

点评

分析一下注册流程,批量注册获取token,然后再套用不同的token去下载  详情 回复 发表于 2022-1-9 23:39
戰龍在野 发表于 2022-1-10 00:13
不知使用方法如何?麻烦一并提供啊谢谢了
pkni1230 发表于 2022-1-10 00:29
持续关注,更新的版本
绿软奔跑者 发表于 2022-1-10 00:32
哇,不明觉厉
头像被屏蔽
dongse 发表于 2022-1-10 07:26
提示: 作者被禁止或删除 内容自动屏蔽
5151diy 发表于 2022-1-10 07:48
只有好好学习python编程,
ospf 发表于 2022-1-10 08:03
不明觉厉
令狐冲了个澡爽 发表于 2022-1-10 08:11
不明觉厉
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 09:53

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表