吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 3318|回复: 35
收起左侧

[Python 转载] 爬回车美女壁纸

[复制链接]
yijiuxiaole 发表于 2021-12-21 19:07
本帖最后由 yijiuxiaole 于 2021-12-21 19:16 编辑

我白票好久了。终于发次贴了。
第一次发帖,如果不好请多多照料
学了爬虫没多久,今天实在无聊,就写了一个爬虫,爬取壁纸的小姐姐
我的命名很随意的,标识符我感觉都能把我愁死,所以咋简单咋来吧!
没有上多线程,慢慢来吧。
大佬误喷哈
网页全是静态的 所以不多说了 上代码代码 如果有什么不好的地方可以一起交流下

import time
import re
import os

import requests

headers = {
    'user-agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.110 Safari/537.36'
}
for z in range(1,10): # 更改页数
    print('正在下载第{}页'.format(z))
    url = 'https://mm.enterdesk.com/{z}.html'
    resp = requests.get(url,headers=headers)
    list1 = []
    urls = re.findall(r'<div><a href="(?P<href>.*?)" target="_blank">(?P<name>.*?)</a>',resp.text,re.S)
    for i in urls:
        name = i[1].strip()
        if not os.path.exists(name):
            os.mkdir(name)
        urls1 = i[0]
        resp1 = requests.get(url=urls1,headers=headers).text
        aa = re.finditer(r'class="pics_pics ".*?href="/bizhi/(?P<href>.*?)".*?title="{}'.format(name),resp1,re.S)
        for i in aa:
            aaa = 'https://mm.enterdesk.com/bizhi/' + i.group('href')
            # print(aaa)
            resp2 = requests.get(url=aaa,headers=headers).text
            dd = re.findall(r' var original_pic = "(.*?)";', resp2, re.S)[0]
            list1.append(dd)
        cc = re.findall(r' var original_pic = "(.*?)";',resp1,re.S)[0]
        list1.append(cc)
        c = 0
        for ii in list1:
            c += 1
            name1 = f'{name}{c}'
            with open(f'{name}/{name1}.jpg','wb') as f:
                f.write(requests.get(url=ii,headers=headers).content)
                print(f'{name1}保存完成')
                time.sleep(2) # 不要太快 
                print('休息两秒哦~')

免费评分

参与人数 4吾爱币 +7 热心值 +4 收起 理由
天才笨蜀黍 + 1 + 1 我很赞同!
onlyclxy + 1 + 1 我很赞同!
刘郝聪明 + 1 用心讨论,共获提升!
苏紫方璇 + 5 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

zzyang115 发表于 2021-12-21 21:57
对于我这样的小白,你不给教程我就只能看看,顺便给个赞
李杨 发表于 2021-12-22 04:45
clocks 发表于 2021-12-21 22:30
chunhwa 发表于 2021-12-21 22:30
谢谢分享。
space218 发表于 2021-12-21 23:42
谢谢分享,先手动浏览一遍!
tbloy 发表于 2021-12-22 00:04
小姐姐,我们来了。支持
photo土豆 发表于 2021-12-22 00:17
支持,支持,还是支持
jixiang 发表于 2021-12-22 06:21
谢谢分享
龍謹 发表于 2021-12-22 07:09
谢谢,学习一下,我也去爬爬看。
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 09:56

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表