吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1452|回复: 12
收起左侧

[Python 原创] 提取图片链接:浏览网页,滑动到网页底部时,筛选出有用的图片链接(无下载代码)。

  [复制链接]
zjg121 发表于 2024-3-27 11:57
适用各种图片类文库,自动滚动页面时可以同时手动操作。当页面见底时,进行图片链接筛选。
[Python] 纯文本查看 复制代码
from selenium import webdriver
from selenium.webdriver.common.by import By
# 等待页面加载完成,这里假设使用显式等待
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
import pyautogui
from time import sleep


# 初始化webdriver
driver = webdriver.Edge()
driver.maximize_window()

# 导航到目标网页
driver.get('https://max.book118.com/html/2024/0309/6134131010010100.shtm')
sleep(10)
# 获取屏幕尺寸
screen_width, screen_height = pyautogui.size()

# 计算屏幕中央的坐标
center_x = screen_width // 2
center_y = screen_height // 2

# 将鼠标移动到屏幕中央
pyautogui.moveTo(center_x, center_y)
sleep(1)
# 在当前位置(屏幕中央)执行单击操作
pyautogui.click()

for i in range(2000):
    # 获取页面总高度
    page_height = driver.execute_script("return document.body.scrollHeight;")

    # 获取当前滚动位置
    scroll_position = driver.execute_script("return window.pageYOffset || document.documentElement.scrollTop;")

    # 判断是否滑动到底部
    if scroll_position >= page_height - 755:
        print("已经滑动到底部")
        break
    else:
        print("还未滑动到底部")

    # 模拟按下向下箭头键
    pyautogui.press('pagedown')
    sleep(2)
wait = WebDriverWait(driver, 10)  # 等待10秒

# 定位页面上的所有图片元素
images = wait.until(EC.presence_of_all_elements_located((By.TAG_NAME, 'img')))

# 提取每个图片的src属性(即图片链接)
image_links = [img.get_attribute('src') for img in images]
url = []
# 打印图片链接
for link in image_links:
    print(link)
print('--------------------------------------------------------------------------------------------')
text1 = input("请输入需要下载的图片链接的字符串:")
for link in image_links:
    try:
        if text1 in link:
            url.append(link)
    except:
        pass
for ul in url:
    print(ul)
a = input("是否下载图片?(y/n)")
# 清理资源
driver.quit()

免费评分

参与人数 5吾爱币 +12 热心值 +5 收起 理由
爱飞的猫 + 7 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!
laozhang4201 + 1 + 1 热心回复!
黄色土豆 + 1 + 1 谢谢@Thanks!
orb001 + 2 + 1 谢谢@Thanks!
aabbcc123123 + 1 + 1 谢谢@Thanks!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

huangjinjia08 发表于 2024-3-27 13:52
感谢分享~~~~~~~~~~~~~~~~~~~~~~~~~~~~
头像被屏蔽
cwwen 发表于 2024-3-27 13:52
chaoren1aa29 发表于 2024-3-27 14:15
李亲顾 发表于 2024-3-27 14:33
谢谢,没有成品吗?不懂
ColaHyn666 发表于 2024-3-27 17:35
感谢分享哇呀
Respect2900 发表于 2024-3-28 10:17
太强了,向大佬学习
hllolyl 发表于 2024-3-28 12:44
不好意思Python一窍不通,看不懂
gmc333 发表于 2024-3-28 12:45
学习了,感谢分享
danyuhuanxiang 发表于 2024-3-28 15:50
感谢分享
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-24 16:28

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表