提取图片链接：浏览网页，滑动到网页底部时，筛选出有用的图片链接（无下载代码）。

zjg121 · 发表于 2024-3-27 11:57

适用各种图片类文库，自动滚动页面时可以同时手动操作。当页面见底时，进行图片链接筛选。

[Python] 纯文本查看 复制代码

from selenium import webdriver
from selenium.webdriver.common.by import By
# 等待页面加载完成，这里假设使用显式等待
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
import pyautogui
from time import sleep


# 初始化webdriver
driver = webdriver.Edge()
driver.maximize_window()

# 导航到目标网页
driver.get('https://max.book118.com/html/2024/0309/6134131010010100.shtm')
sleep(10)
# 获取屏幕尺寸
screen_width, screen_height = pyautogui.size()

# 计算屏幕中央的坐标
center_x = screen_width // 2
center_y = screen_height // 2

# 将鼠标移动到屏幕中央
pyautogui.moveTo(center_x, center_y)
sleep(1)
# 在当前位置（屏幕中央）执行单击操作
pyautogui.click()

for i in range(2000):
    # 获取页面总高度
    page_height = driver.execute_script("return document.body.scrollHeight;")

    # 获取当前滚动位置
    scroll_position = driver.execute_script("return window.pageYOffset || document.documentElement.scrollTop;")

    # 判断是否滑动到底部
    if scroll_position >= page_height - 755:
        print("已经滑动到底部")
        break
    else:
        print("还未滑动到底部")

    # 模拟按下向下箭头键
    pyautogui.press('pagedown')
    sleep(2)
wait = WebDriverWait(driver, 10)  # 等待10秒

# 定位页面上的所有图片元素
images = wait.until(EC.presence_of_all_elements_located((By.TAG_NAME, 'img')))

# 提取每个图片的src属性（即图片链接）
image_links = [img.get_attribute('src') for img in images]
url = []
# 打印图片链接
for link in image_links:
    print(link)
print('--------------------------------------------------------------------------------------------')
text1 = input("请输入需要下载的图片链接的字符串：")
for link in image_links:
    try:
        if text1 in link:
            url.append(link)
    except:
        pass
for ul in url:
    print(ul)
a = input("是否下载图片？(y/n)")
# 清理资源
driver.quit()

huangjinjia08 · 发表于 2024-3-27 13:52

感谢分享~~~~~~~~~~~~~~~~~~~~~~~~~~~~

cwwen · 发表于 2024-3-27 13:52

提示: 作者被禁止或删除内容自动屏蔽

chaoren1aa29 · 发表于 2024-3-27 14:15

谢谢楼主分享！

李亲顾 · 发表于 2024-3-27 14:33

谢谢，没有成品吗？不懂

ColaHyn666 · 发表于 2024-3-27 17:35

感谢分享哇呀

Respect2900 · 发表于 2024-3-28 10:17

太强了，向大佬学习

hllolyl · 发表于 2024-3-28 12:44

不好意思Python一窍不通，看不懂

gmc333 · 发表于 2024-3-28 12:45

学习了，感谢分享

danyuhuanxiang · 发表于 2024-3-28 15:50

感谢分享

帐号		自动登录	找回密码
密码			注册[Register]

cwwen cwwen 当前离线好友阅读权限 0 听众最后登录 1970-1-1 头像被屏蔽	cwwen 发表于 2024-3-27 13:52 吾爱破解论坛没有任何官方QQ群，禁止留联系方式，禁止任何商业交易。提示: 作者被禁止或删除内容自动屏蔽
	如何升级？如何获得积分？积分对应解释说明！
	回复支持举报

[Python 原创] 提取图片链接：浏览网页，滑动到网页底部时，筛选出有用的图片链接（无下载代码）。

免费评分