【原创源码】【python】爬虫--壁纸

Dlam万能的猫 · 发表于 2022-3-18 22:28

本帖最后由 Dlam万能的猫于 2022-3-18 22:45 编辑

【原创源码】【python】爬虫--壁纸

需要下载requests，bs4两个库

py文件放到哪里，图片就保存到哪里

代码：

import requests
from bs4 import BeautifulSoup
import re

for page in range(1, 1229):
    print('正在下载第' + str(page) + '页...')
    url = 'http://www.netbian.com/index_' + str(page) + '.htm'
    if page == 1:
        url = 'http://www.netbian.com/index.htm'  # 第一页 url 与后面不同，做一下替换
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.45 Safari/537.36'}
    response = requests.get(url, headers=headers)
    bs = BeautifulSoup(response.content, 'lxml')
    li_list = bs.find('div', class_="list").ul.find_all('li')  # 获取li标签
    for i in li_list:
        href = i.find('a')['href']
        if '/desk' in href:
            number = re.findall("\d+", href)[0]
            pic_url = 'http://www.netbian.com/desk/' + number + '-1920x1080.htm'  # 深层页面
            response2 = requests.get(pic_url, headers=headers)
            bs2 = BeautifulSoup(response2.content, 'lxml')
            final_url = bs2.find('td').a['href']  # 图片下载地址
            pic_name = bs2.find('td').a['title'] + '.jpg'  # 图片名字
            response3 = requests.get(final_url, headers=headers)
            with open(pic_name, 'wb') as f:
                f.write(response3.content)

运行截图：

运行截图

Dlam万能的猫 · 发表于 2022-3-19 14:48

importlove 发表于 2022-3-19 10:56
感谢楼主，想请教如果需要下载验证码，或者需要进入下一层页面后怎么爬取呢？

这太难了，我直接放弃

suoai216 · 发表于 2022-3-18 23:54

这个网站要注册才能下载吧

lanlano · 发表于 2022-3-19 00:06

我这种小白看不懂啊。。。跟看天书一样。。

闹森 · 发表于 2022-3-19 00:09

基本上是看太书📖

x3zjjj · 发表于 2022-3-19 00:47

感觉我Python学了个寂寞

cy2931 · 发表于 2022-3-19 09:13

谢学习啦，感谢大佬

wikiyc · 发表于 2022-3-19 09:43

好思路，谢谢分享。

32K · 发表于 2022-3-19 10:44

好思路，拿去实践下

ncu.xxy · 发表于 2022-3-19 10:52

一千多页，你试试加个线程或者协程

importlove · 发表于 2022-3-19 10:56

感谢楼主，想请教如果需要下载验证码，或者需要进入下一层页面后怎么爬取呢？

帐号		自动登录	找回密码
密码			注册[Register]

[Python 原创] 【原创源码】【python】爬虫--壁纸

【原创源码】【python】爬虫--壁纸

需要下载requests，bs4两个库

py文件放到哪里，图片就保存到哪里

代码：

运行截图：