吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2246|回复: 9
收起左侧

[Python 转载] Python爬虫获取某岸桌面网站壁纸

  [复制链接]
py爱好者 发表于 2022-8-26 20:37
小白一枚,大佬轻喷。。。这两天突然想学爬虫,主要还是因为硬盘剩余空间挺大的,觉得有点浪费,所以想装点使人耳目一新的文件进去


[Python] 纯文本查看 复制代码
import requests
import os
from lxml import html

etree = html.etree

url = "http://www.netbian.com/meinv"
domain = "http://www.netbian.com"
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/104.0.5112.102 Safari/537.36 Edg/104.0.1293.63"
}
pwd = os.getcwd()
if os.path.exists(pwd+"\\img"):
    pass
else:
    print(f"妹子的豪华套房:{pwd}\img")
    os.mkdir(pwd+"\\img")

def down():
    html_data = etree.HTML(response.text)
    lis = html_data.xpath('//*[@id="main"]/div[3]/ul/li')
    for li_url in lis:
        li_urls = li_url.xpath(".//a/@href")[0]
        # 过滤广告图片
        if "http" in li_urls:
            print("有广告图片诱导链接!已跳过...")
            pass
        else:
            # 请求子页面
            child_html = requests.get(domain + li_urls, headers=headers)
            child_html.encoding = 'gb2312'
            # 解析
            child_html_data = etree.HTML(child_html.text)
            # 获取图片地址
            photo_url = child_html_data.xpath("/html/body/div[2]/div[2]/div[3]/div/p/a/img/@src")[0]
            # 获取图片名
            photo_name = child_html_data.xpath("/html/body/div[2]/div[2]/div[3]/div/p/a/img/@title")[0]
            # 下载
            print(f"正在导入妹子: {photo_name}")
            with open(f"{pwd}/img/" + photo_name + ".jpg", mode='wb') as f:
                photo_data = requests.get(url=photo_url, headers=headers)
                f.write(photo_data.content)

i = 1
while i < 64:
    if i <2:
        response = requests.get(url=url, headers=headers)
        down()
    else:
        response = requests.get(url=url+f"/index_{i}.htm", headers=headers)
        down()
    i += 1

print("导入完成! 开始欣赏吧...")



成品地址:https://www.aliyundrive.com/s/3hjWQfVwbxw

免费评分

参与人数 2吾爱币 +2 热心值 +2 收起 理由
梦里lm + 1 + 1 我很赞同!
chinagdzhao + 1 + 1 我很赞同!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

水上凌波 发表于 2022-8-27 00:52
这个文件在哪下
截图1.png
grekevin 发表于 2022-8-27 08:12
1315005441 发表于 2022-8-27 08:37

++

%B6%BC%CA%C71m%D7%F3%D3%D2%B5%C4%CD%BC%C6%AC+%D3%D0%B8%DF%BB%AD%D6%CA%B5%C4%C2%EF%A3%BF
feiyu361 发表于 2022-8-27 09:00
这些妹子漂亮呀
 楼主| py爱好者 发表于 2022-8-27 17:07

缺少依赖组件,百度一下呢
 楼主| py爱好者 发表于 2022-8-27 17:08
grekevin 发表于 2022-8-27 08:12
原版图片可以搞 吗?

程序下载的就是某岸网原汁原味的
aspllh 发表于 2022-9-26 21:11
感谢分享。正在试用。
chinagdzhao 发表于 2022-10-1 11:04
可以用,如果能自定义下载就更好!
lin2lin3lin5 发表于 2022-10-1 22:11
本帖最后由 lin2lin3lin5 于 2022-10-2 15:09 编辑

10月1日中午还是可用的。可能爬多了,到了晚上,网站,有页面跳转。
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 02:58

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表