吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2396|回复: 14
收起左侧

[Python 转载] wallhaven壁纸python爬取

[复制链接]
datalai 发表于 2022-7-5 18:39
本帖最后由 datalai 于 2022-7-6 10:40 编辑

wallhaven壁纸真的太好看了!!!
网址:
[Python] 纯文本查看 复制代码
https://wallhaven.cc/hot

只是有时候网站访问太慢的问题没法解决
Windows能自动换壁纸

Windows能自动换壁纸

Windows能自动换壁纸

就幻灯片放映,然后换片频率页可以设置,python爬取图片地址放到那个文件夹下就很完美了(尽量别用中文路径吧!
只是没动图,基本上是静态的,毕竟都是嫖的图片,就wallhaven比较良心了哈哈哈
右键也可以,切换下一张,毕竟是Windows的没什么广告

切换下一张

切换下一张


看看保存的图片

保存图片

保存图片


源码下载地址:
https://wwt.lanzoui.com/iwPTx07ewn4b
密码:10086
访问不了把.lanzoui 最后一位 i 改成 x
直接复制源码也行
源码放送:
[Python] 纯文本查看 复制代码
# -*- codeing = utf-8 -*-
# @Time: 2022/4/8 0:02
# @Software: PyCharm
# @File: wallhavenBiZhi.py
import requests
from lxml import etree
import time
import random


class BZ():

    # 实例化etree
    def tree(self,e):
        return etree.HTML(e)

    #获取到图片的content
    def getBZ(self,url):

        # 翻页10页
        for page in range(1,10):

            headers = {
                # 'referer': 'https://wallhaven.cc/',
                'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/537.36',
            }
            print(time.strftime("%H:%M:%S"))

            #随机爬取第1到50页
            # page=random.randint(1,50)
            print("第{}页".format(page))

            url1 = url.format(page)
            # 一级页面请求
            html = requests.get(url=url1, headers=headers, timeout=5.0).text
            data = self.tree(html)
            li_list = data.xpath('.//div[@id="thumbs"]//li')
            # print(li_list)
            # 每一张图片的url地址
            for li in li_list:
                img = li.xpath('.//img[@class="lazyload"]/@data-src')
                if img:
                    img=img[0]
                    img_end=img[-10:]

                    tupian_url='https://w.wallhaven.cc/full/'+img[-10:-8]+'/wallhaven-'+img_end

                    tupian = requests.get(url=tupian_url, headers=headers, timeout=5.0)
                    if tupian.status_code == 404:
                        # print(img_end)
                        img_end = img_end[:-3] + 'png'

                        tupian_url = 'https://w.wallhaven.cc/full/' + img[-10:-8] + '/wallhaven-' + img_end

                        tupian = requests.get(url=tupian_url, headers=headers, timeout=5.0)


                    content_picture = tupian.content

                    self.save_picture(img_end,content_picture)
                    print(tupian_url)

    # 保存图片
    def save_picture(self,img_end,content_picture):
        # 保存路径

        with open('C:/Users/19873/Pictures/bizhi/' + img_end, 'wb') as file:
            file.write(content_picture)

            print('保存完成' + time.strftime("%H:%M:%S"))


if __name__ == '__main__':
    url='https://wallhaven.cc/hot?page={}'
    bz=BZ()
    bz.getBZ(url)



免费评分

参与人数 4吾爱币 +8 热心值 +4 收起 理由
hjhj525 + 1 + 1 我很赞同!
苏紫方璇 + 5 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!
Topspion + 1 + 1 谢谢@Thanks!
20220222 + 1 + 1 谢谢@Thanks!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| datalai 发表于 2022-7-6 11:27
chuanglue 发表于 2022-7-5 22:31
楼主,漏掉了蓝奏提取码了吧?

哈哈,忘记了密码10086 我更新了一下,源码也直接复制吧
hjhj525 发表于 2022-11-5 18:44
forzamilanacc 发表于 2022-7-7 16:42
wangnike 发表于 2022-7-6 14:36
感谢分享哦
JMILOVEYOU 发表于 2022-7-6 14:25
这网站裸连 一会可以一会不行
 楼主| datalai 发表于 2022-7-6 10:38
ll018213 发表于 2022-7-5 22:11
蓝奏云密码是?

10086,建议直接复制源码
 楼主| datalai 发表于 2022-7-6 10:37
eventually 发表于 2022-7-6 08:10
直接复制应该也行吧

可以可以
feiyu361 发表于 2022-7-6 09:12
这个网址不赖啊
chentest 发表于 2022-7-6 08:53
python 爬虫html数据解析 推荐使用库

pyquery 库
beautifulsoup库
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 02:54

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表