吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2707|回复: 10
收起左侧

[Python 转载] 新手向百度图片爬虫没啥技术哈哈主要是我太菜了

[复制链接]
cdsgg 发表于 2021-1-18 18:50
[Python] 纯文本查看 复制代码
import os
import requests
from urllib.parse import quote

kw = quote('表情包')#把文字编码成urlencode的

pn = 30  # 一页等于30 两页等于60 以此类推

url = f'https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&word={kw}&pn={pn}&rn=30'  # rn是一页显示多少个的意思

headers = {
    'Referer': 'https://image.baidu.com/search/index?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=-1&st=-1&sf=1&fmq=&pv=&ic=0&nc=1&z=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&ie=utf-8&fm=result&pos=history&word=%E8%A1%A8%E6%83%85%E5%8C%85',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.81 Safari/537.36 SE 2.X MetaSr 1.0',
    'Host': 'image.baidu.com'}

req = requests.get(url=url, headers=headers).json()

# print()
a = 1

for i in req['data']:
    try:
        print(i['thumbURL'])
        with open(f'{a}.{os.path.splitext(i["thumbURL"])[-1]}', 'wb') as f:  # 这里我随便给图片数字的标题 你们喜欢的话可以随便弄无所谓的 os.path.splitext(i["thumbURL"])[-1] 获取后缀名
            f.write(requests.get(i['thumbURL']).content)
            f.close()
        a = a + 1
    except Exception as e:
        print(e)

也没啥技术含量 适合新手
GIF 2021-1-18 18-48-03.gif

免费评分

参与人数 2吾爱币 +1 热心值 +2 收起 理由
szllw + 1 + 1 新手加油
美丽的渗透者 + 1 用心讨论,共获提升!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

大兵马元帅 发表于 2021-1-18 19:23
厉害,我学习python已经没有动力了,不知道学什么了
Jack-yu 发表于 2021-1-18 19:34
deyen 发表于 2021-1-18 20:14
hezongzhi 发表于 2021-1-25 13:56
问一下你这个代码  怎么获取更多呢  pn 我试了120 还是只有30个图片  我想获取 第23456更多页的图片
 楼主| cdsgg 发表于 2021-1-25 15:08
hezongzhi 发表于 2021-1-25 13:56
问一下你这个代码  怎么获取更多呢  pn 我试了120 还是只有30个图片  我想获取 第23456更多页的图片

价格for 循环
ahehaoyu 发表于 2021-1-27 13:42
厉害了  加油加油
learm 发表于 2021-6-16 13:56
我废了,环境都配置不好
wkh9527 发表于 2021-6-16 14:33
谢谢楼主,学到知识了
一条游泳的鱼 发表于 2021-6-18 13:42
感谢楼主分享
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2025-1-15 13:34

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表