吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1762|回复: 3
收起左侧

[Python 转载] 使用requests爬取糗图百科的热图

[复制链接]
一肖没有脾气 发表于 2021-4-13 16:23
import requests
import re
import os

if __name__ == "__main__":
    headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.90 Safari/537.36"
    }
    #在当下目录下生成文件夹qiutu,用来保存爬取的图片
    if not os.path.exists("./qiutu"):   #path.exists用来判断目录是否存在
        os.mkdir("./qiutu")             #生成目录qiutu
    #设置一个通用的url模板
    url = "https://www.qiushibaike.com/imgrank/page/%d/"
    for pageNum in range(1,36):     
        #构建一个对应页数的url
        new_url = format(url%pageNum)
        page_text = requests.get(url=new_url,headers=headers).text
        ex = r'<div class="thumb">.*?<img src="(.*?)" alt.*?</div>'
        img_src_list = re.findall(ex, page_text,re.S)
        # print(img_src_list)
        for src in img_src_list:
            # 拼接网址
            src1 = "https:"+src
            img_data = requests.get(url=src1,headers=headers).content
            # 生成图片名称
            img_name = src1.split("/")[-1]
            #生成路径
            img_Path = "./qiutu/" + img_name
            with open(img_Path,"wb")as fp:
                fp.write(img_data)
                print(img_name,"下载成功")

免费评分

参与人数 1吾爱币 +5 热心值 +1 收起 理由
苏紫方璇 + 5 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

Jack-yu 发表于 2021-4-13 17:39
不错不错继续加油
kxs2018 发表于 2021-4-13 18:38
xiong779 发表于 2021-4-14 12:57
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-29 10:17

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表