吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 5593|回复: 57
收起左侧

[Python 原创] 【原创python代码】520到了,送给各位单身狗一些妹子 Python爬虫

  [复制链接]
孤霜情冷点朱砂 发表于 2021-5-18 19:02
源代码和部分结果已经发出来了~  【质量高的一批
颜值超高美女头像.jpg ins2021最清新美女头像.jpg 缩略图.png
[Python] 纯文本查看 复制代码
import requests
import os
import time
from bs4 import BeautifulSoup
import random
import urllib.request

#频繁怎么办?1.函数回调 2.延迟 3.response.close() 4.socket.setdefaulttimeout(t_default) 5换代{过}{滤}理

#https://www.huiyi8.com/search/%E7%BE%8E%E5%A5%B3/1.html
#https://www.huiyi8.com/search/%E7%BE%8E%E5%A5%B3/2.html



last_page=int(input("请输入要爬取的页数:"))
n=0
headers={}
for page in range(1,last_page+1):
    print("正在爬取第{}页的图片...".format(page))
    user_agent_list = [
        "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36",
        "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36",
        "Mozilla/5.0 (Windows NT 10.0; WOW64) Gecko/20100101 Firefox/61.0",
        "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.186 Safari/537.36",
        "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.62 Safari/537.36",
        "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36",
        "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0)",
        "Mozilla/5.0 (Macintosh; U; PPC Mac OS X 10.5; en-US; rv:1.9.2.15) Gecko/20110303 Firefox/3.6.15",
    ]
    headers['User-Agent'] = random.choice(user_agent_list)
    html=requests.get("https://www.huiyi8.com/search/%E7%BE%8E%E5%A5%B3/{}.html".format(page),headers=headers)
    soup=BeautifulSoup(html.text,'lxml')
    link=soup.select("li.works-box.fl.b-box div a")

    for i in link:
        true_html=requests.get(i['href'],headers=headers)
        time.sleep(random.randint(1,5))
        new_soup=BeautifulSoup(true_html.text,'lxml')
        new_link=new_soup.select_one('div.imgcont img')

        if not os.path.exists('520妹子图'):
            os.mkdir('520妹子图')
        # with open('520妹子图/{}.jpg'.format(i.text),'wb')as f:
        #     f.write(requests.get(new_link['src'],headers=headers).content)
        print(new_link['src'])
        urllib.request.urlretrieve(new_link['src'],'520妹子图/{}.jpg'.format(i.text))
        n+=1
        print("第{}张图片下载完成......".format(str(n)))
        time.sleep(random.randint(1,5))




部分图片:https://wwi.lanzoui.com/iOlI4p8ueda

免费评分

参与人数 4吾爱币 +6 热心值 +4 收起 理由
QingYi. + 3 + 1 十分感谢
孺子韫 + 1 + 1 我很赞同!
搬砖孩子要毕业 + 1 + 1 哈哈,有意思有意思
默认布欧哈兰德 + 1 + 1 我很赞同!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

lyl610abc 发表于 2021-5-18 19:27
qianshang666 发表于 2021-5-18 19:14
能爬到真人吗,还缺女朋友呢!

性别不要定得那么死,可以考虑男朋友
 楼主| 孤霜情冷点朱砂 发表于 2021-5-20 15:13
sCookie 发表于 2021-5-20 13:29
筛选条件是哪一行,我按我喜好来选一下(来自一名小白的疑惑)

https://www.huiyi8.com/search/%E7%BE%8E%E5%A5%B3/     search后面的是分类,只不过将汉字编码成其他格式了
15278066219 发表于 2021-5-18 19:07
璐璐诺 发表于 2021-5-18 19:09
能爬到真人嘛,还缺女朋友呢
shmx1 发表于 2021-5-18 19:12
单身狗集合
Eternidad-Li 发表于 2021-5-18 19:14
能爬到真人嘛,还缺女朋友呢
头像被屏蔽
去你的吧 发表于 2021-5-18 19:14
提示: 作者被禁止或删除 内容自动屏蔽
qianshang666 发表于 2021-5-18 19:14
能爬到真人吗,还缺女朋友呢!
站稳扶好 发表于 2021-5-18 19:16

能爬到真人吗,还缺女朋友呢!
shadowchen2001 发表于 2021-5-18 19:16
能爬到真人嘛,还缺女朋友呢
guitarandher 发表于 2021-5-18 19:22
能爬到真人嘛,还缺女朋友呢
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 16:34

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表