吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 10041|回复: 81
收起左侧

[Python 转载] 爬取美女图片(原创)

  [复制链接]
在外DE孩子 发表于 2021-3-16 23:57
import requests
import re
import time
import os

# url = 'https://www.vmgirls.com/13344.html'

def get_pic(url):
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36'
    }

    response = requests.get(url, headers=headers)
    html = response.text
    # print(response.text)

    dir_name = re.findall('<h1 class="post-title h1">(.*?)</h1>',html)[-1]
    if not os.path.exists(dir_name):
        os.mkdir(dir_name)

    urls = re.findall('<a href="(.*?)" alt=".*?" title=".*?">', html)
    for url_data in urls:
        # time.sleep(1)
        urls_data = "https:" + url_data
        print(urls_data)
        # 图片的名称
        file_name = urls_data.split('/')[-1]
        # print(file_name)
        response_data = requests.get(urls_data, headers = headers)
        # print(response_data.content)
        with open(dir_name + '/' + file_name, 'wb') as f:
            f.write(response_data.content)

url_list =[
    'https://www.vmgirls.com/13344.html',
    'https://www.vmgirls.com/15881.html',
    'https://www.vmgirls.com/15400.html',
    'https://www.vmgirls.com/15323.html',
    'https://www.vmgirls.com/15370.html'

]

for url1 in url_list:
    get_pic(url1)

免费评分

参与人数 17吾爱币 +16 热心值 +15 收起 理由
wangkai558 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
KuangXun + 1 我很赞同!
ysw295320 + 1 + 1 谢谢@Thanks!
yefei1015 + 1 + 1 热心回复!
yt13299374849 + 1 + 1 我很赞同!
culprit + 1 + 1 修改版:https://www.52pojie.cn/thread-1394757-1-1.html
林大钦 + 1 亲测可用!
朴彩英 + 1 + 1 用心讨论,共获提升!
不许人间见白头T + 2 + 1 用心讨论,共获提升!
kingaero + 2 + 1 谢谢@Thanks!
云观水 + 1 用心讨论,共获提升!
听雨轩灬烟雨 + 1 + 1 用心讨论,共获提升!
lfm333 + 1 谢谢@Thanks!
aboutz + 1 + 1 谢谢@Thanks!
lichu_2004 + 1 + 1 谢谢@Thanks!
星空下的流星 + 1 热心回复!
knite + 1 + 1 66

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

ma5635 发表于 2021-3-17 00:25
就是来看网站的,爬取就算了,暂时看不懂!
James521 发表于 2021-7-7 22:45
yuleniwo 发表于 2021-3-17 08:34
谢谢分享!要是能再智能点就好了。另外vmgrils网站好卡,不知道是不是我装了ublock的原因。

这个网站就是有些卡顿,也是做了些反扒的。
褚褚先生 发表于 2021-3-17 00:24
MAXminSCA 发表于 2021-3-17 00:33
hxd直接给源码可太强了!为啥不发GitHub呢?
北岛明仁 发表于 2021-3-17 00:36
可以的这个。
Cd仁进 发表于 2021-3-17 00:49
爬取出来的图有水印吗
雾都孤尔 发表于 2021-3-17 01:01
有没有爬出来的样图看看效果?
云朵上de流年 发表于 2021-3-17 02:29
python呀!!!!!!我也在学习
红蓝黄 发表于 2021-3-17 02:40
可以按图识别爬取吗
z3264 发表于 2021-3-17 04:53
太给力了
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 03:25

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表