吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 4119|回复: 24
收起左侧

[Python 转载] python抓取百度图片

  [复制链接]
孤城2002 发表于 2019-7-23 00:06
本帖最后由 孤城2002 于 2019-7-23 00:11 编辑

直接上代码


import requests
import re
import time
from urllib import parse

name = "崩坏3"  # 搜索的关键字
name_url = {'word': name}
name_word = parse.urlencode(name_url)  # 编码转换
y = 0  # 页数计数,从0开始依次加60,百度的3页为这里的一页
i = 1  # 文件计数
# 模仿浏览器
headers = {
    'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3',
    'Accept-Encoding': 'gzip, deflate',
    'Accept-Language': 'zh-CN,zh;q=0.9',
    'Cache-Control': 'max-age=0',
    'Connection': 'keep-alive',
    'Upgrade-Insecure-Requests': '1',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'
}
while True:
    url = 'http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&sid=&' + name_word + '&pn=' + str(y)
    print('第' + str(int(y / 60)) + '页')
    data = requests.get(url, headers=headers).text  # 获取页面数据
    url_img = re.findall('"objURL":".*?",', data)
    # 遍历图片url
    for s in url_img:
        img_url = s.lstrip('"objURL":"').rstrip('",')
        img_fi = s.lstrip('"objURL":"').rstrip('",')[-4:]  # 获取拓展名
        img_name = img_url.split('/')[-1].rstrip(img_fi)
        img_le = img_fi[-4]
        if img_le == ".":  # 筛选数据
            try:  # 异常处理
                img = requests.get(img_url, headers=headers).content
                # 保存图片
                with open('img/' + img_name + img_fi, 'wb') as f:
                    f.write(img)
                    print("图片" + img_name + ' 第' + str(i) + '张' + " 地址:" + img_url)
                    time.sleep(1)
                    i = i + 1
            except:
                print('访问链接出错')
    y = y + 60


最好使用pycharm进行运行
安装要使用的模块:requests,urllib
不会安装的百度有详细的安装教程,这个是我无聊的时候写的,可以拿去抓qq表情包还有其它有趣的图
也可以供大家学习。

免费评分

参与人数 5吾爱币 +4 热心值 +3 收起 理由
ailmdg + 1 我很赞同!
hj592207079 + 1 谢谢分享!
七色月光 + 1 + 1 我很赞同!
叶樱枫 + 1 + 1 谢谢@Thanks!
kejiashan + 1 热心回复!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| 孤城2002 发表于 2019-7-23 11:26
12416436 发表于 2019-7-23 09:30
学习python感觉进步的好慢,真希望很快能写出自己的代码分享给大家

只要坚持,重在于理解,加油
fuzheng 发表于 2019-7-23 00:17
a312714497 发表于 2019-7-23 00:18
彭哥列第十代 发表于 2019-7-23 00:24
提示链接出错
怎么办
Pdsdt 发表于 2019-7-23 01:00
抓取照片的话,用BeautifulSoup还是挺方便的把
小2b 发表于 2019-7-23 02:12
....效果啥的貼一下吧,雖然很多人會爬蟲,但為了帖子不那麼乾枯無味,貼點圖會好點
lyw8614505 发表于 2019-7-23 02:16
谢谢楼主分享,技术流支持一下
字母 发表于 2019-7-23 02:45
这玩意没用啊…
张碗婷 发表于 2019-7-23 05:57
厉害   太厉害了   
轮回过客 发表于 2019-7-23 06:56
请问这个和QQ群的机器人抓去图片的原理一样吗?
如有回复不胜感激
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-16 11:35

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表