吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 8682|回复: 31
收起左侧

[Python 转载] 美女小姐姐壁纸又来了~

  [复制链接]
yijiuxiaole 发表于 2021-12-22 12:42
本帖最后由 yijiuxiaole 于 2021-12-22 12:47 编辑

在来个简单的爬虫
上个帖子有人说,不出教程差评,这次我出了,给个好评.hhh
还是那句话 我变量名很随意的 不要跟我学 不是太会排版

http://bz.hzwdd.cn/ 这是网站 右键检查 或者f12 你们慢点弄 毕竟谁也不容易是不是嘞  仅供学习
1.png
2.png

带来两个版本 一个是单线程 另一个是线程池(不要太狠) 用第一个就好 你们记得改页数 我弄的是美女模特
[Python] 纯文本查看 复制代码
import time
import os


import requests # 网络请求

if not os.path.exists('壁纸'): # 检测文件夹是否存在 不存在则创建
    os.mkdir('壁纸')


def get_url(url):
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36'
    }
    print('正在下载' + '*****' + url)
    response = requests.get(url, headers=headers) # 进行请求
    a = response.json() # 请求返回的是json数据
    urls = a['data']['list']
    for i in urls:
        id = i['id']
        ulss = i['url'] # 得到真实的url
        response1 = requests.get(url=ulss,headers=headers) # 在请求
        aa = response1.content # 保存二进制
        f = open(f'./壁纸/{id}.jpg', 'wb')
        f.write(aa) # 写入
        f.close()
        print(f'保存成功{ulss}')
        time.sleep(2)
        print('休息2秒哦')


if __name__ == '__main__':

    for i in range(3): # 页数
        get_url(f'http://bz.hzwdd.cn/api.php?cid=6&start={i}&count=10') # url


这个是线程池
[Python] 纯文本查看 复制代码
import time
import os

import requests
from concurrent.futures import ThreadPoolExecutor

if not os.path.exists('壁纸'):
    os.mkdir('壁纸')


def get_url(url):
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36'
    }
    print('正在下载'+'*****'+url)
    response = requests.get(url, headers=headers)
    a = response.json()
    urls = a['data']['list']
    for i in urls:
        id = i['id']
        ulss = i['url']
        response1 = requests.get(url=ulss,headers=headers)
        time.sleep(1)
        aa = response1.content
        f = open(f'./壁纸/{id}.jpg', 'wb')
        f.write(aa)
        f.close()
        print(f'保存成功{ulss}')
        time.sleep(1)

    
if __name__ == '__main__':
    with ThreadPoolExecutor(50) as t:
        for i in range(3): # 页数
            t.submit(get_url, f'http://bz.hzwdd.cn/api.php?cid=6&start={i}&count=10') # 4k壁纸cid=360new
            time.sleep(2)
            print('休息2秒哦')
    print('全部下载完成')

免费评分

参与人数 10吾爱币 +9 热心值 +10 收起 理由
rootcup + 1 + 1 我很赞同!
ggsxjll + 1 + 1 谢谢@Thanks!
尽欢宁 + 1 + 1 谢谢@Thanks!
lzhpolk36 + 1 我很赞同!
Aguilera + 1 + 1 我很赞同!
lichu_2004 + 1 + 1 谢谢@Thanks!
airwenlee + 2 + 1 谢谢@Thanks!
brightwill + 1 + 1 谢谢@Thanks!
csclc + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
swsjjdcs + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

PingFana 发表于 2022-4-12 22:44
yijiuxiaole 发表于 2021-12-22 19:29
我打包的可能有点大 我没用虚拟环境
成品如下 这个是单线程的
https://wwi.lanzouo.com/i5r3Mxvglbc

想问下爬完了照片下载保存到哪里了
 楼主| yijiuxiaole 发表于 2021-12-22 19:29
小星学破解 发表于 2021-12-22 18:02
Python没下载,能否来个成品

我打包的可能有点大 我没用虚拟环境
成品如下 这个是单线程的
https://wwi.lanzouo.com/i5r3Mxvglbc
blue1996 发表于 2021-12-22 16:40
wgnld 发表于 2021-12-22 16:48
这个可以有
Aguilera 发表于 2021-12-22 16:58
很想学这个嘿嘿
忧郁之子 发表于 2021-12-22 16:59
谢谢分享,支持一下,可以改成易语言的
lossweight 发表于 2021-12-22 17:42
爬的不错 下次不许再爬了
Stap 发表于 2021-12-22 17:45
秀得一手好操作,我也想爬一下
小星学破解 发表于 2021-12-22 18:02
Python没下载,能否来个成品
tosm 发表于 2021-12-22 19:01
又抓小姐姐呀
lmt19841123 发表于 2021-12-22 19:29
是啊 不能下 弄个成品可否
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 04:38

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表