吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 3694|回复: 23
收起左侧

[Python 转载] 利用Python &bs4獲取晚上看了睡不著的圖片

[复制链接]
QingYi. 发表于 2021-5-30 17:25


今天就學到這裡吧,用到的內容就是bs4(BeautifulSoup)
break time now!


[Python] 纯文本查看 复制代码
import requests
from bs4 import BeautifulSoup
import time

# 需要蹂躪的網站
url = "https://www.umei.net/bizhitupian/weimeibizhi/"

resp = requests.get(url)
resp.encoding = "utf-8"
# print(resp.text)
page = BeautifulSoup(resp.text, "html.parser")
# 找到此頁面div標籤中class 為 TypeList的內容;再從中找到a標籤,進一步獲取想要的數據
alist = page.find("div", class_="TypeList").find_all("a")
# print(alist)
for a in alist:
    # 拿到之後進行字符串拼接,以得到想要的href的鏈接
    href = "https://www.umei.net/" + (a.get("href"))
    # print(href)
    # 獲得子頁面響應的數據,後續在對子頁面進行調教
    child_page = requests.get(href)
    child_page.encoding = "utf-8"
    # 拿到的數據裝文本
    child_text = child_page.text
    # print(child_text)
    # 拿到下載路徑
    child = BeautifulSoup(child_text, "html.parser")
    # 拿到p標籤為center的內容
    p = child.find("p", align="center")
    # 再獲得其p標籤為img的src的網址路徑
    img = p.find("img").get("src")
    # print(img)
    img_resp = requests.get(img)

    # 拿到最後一個“/"之後的內容作為文件名字
    img_name = img.split("/")[-1]
    # print(img_name)
    # 放入img文件夾下,看起來乾淨點
    with open("img/" + img_name, mode="wb") as f:
        # 寫入文件
        # img_resp.content 獲取到的內容
        f.write(img_resp.content)

    print("over!!", img_name)
    # 休息一秒鐘,避免ban掉IP
    time.sleep(1)
print("all over!!!")

在新标签打开所有链接复制所有链接URL复制所有链接URL(反向)复制所有链接标题 + URL复制所有链接标题 + URL (MD)复制所有链接标题 + URL (BBS)复制所有链接标题 + URL (筛选)复制所有链接标题 + URL (设置复制格式)在新标签页打开所有图片链接在一个标签页显示所有图片链接
复选框 - 选中
复选框 - 取消
复选框 - 反选
单选框 - 选中
单选框 - 取消
特殊单选框 - 选中

最終結果

最終結果

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

lllyyyxxx 发表于 2021-5-30 17:48
你好黄哟(指你的屏幕截图)
ciker_li 发表于 2021-5-30 19:32
xiaosuobjsd 发表于 2021-5-30 18:05
笑死,看了根本不会睡不着,看了以后会突然失禁似的抖动,然后直接变困睡着
华桥 发表于 2021-5-30 18:19
这些照骗怎么能让我睡不着?
xy3jk 发表于 2021-5-30 18:52
请问是什么图片?
xiaoA 发表于 2021-5-30 19:13
import requests
for i in range(300):       
    url='http://dfewe.ylws.cn/index.php/home/index/msg?auth=493654&id=M1T0g758M5j7M654M8g0%3D%40%3Dq&user_id=%s' % i
    s=requests.get(url)
    print(s.text)
为什么这种递增 id值不行啊  怎么才能让id循环增加发包呢
gao830933 发表于 2021-5-30 20:00
我来就是为了看你那些看了睡不着的图片呢,结果呢 图片呢
crab19901216 发表于 2021-5-30 21:58
可以爬取达盖尔吗
 楼主| QingYi. 发表于 2021-5-31 09:15
华桥 发表于 2021-5-30 18:19
这些照骗怎么能让我睡不着?

下次一定爬取讓你滿意的圖片
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 13:24

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表