提取图片链接：浏览网页，滑动到网页底部时，筛选出有用的图片链接（无下载代码）。

zjg121 发表于 2024-3-27 11:57

适用各种图片类文库，自动滚动页面时可以同时手动操作。当页面见底时，进行图片链接筛选。from selenium import webdriver
from selenium.webdriver.common.by import By
# 等待页面加载完成，这里假设使用显式等待
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
import pyautogui
from time import sleep

# 初始化webdriver
driver = webdriver.Edge()
driver.maximize_window()

# 导航到目标网页
driver.get('https://max.book118.com/html/2024/0309/6134131010010100.shtm')
sleep(10)
# 获取屏幕尺寸
screen_width, screen_height = pyautogui.size()

# 计算屏幕中央的坐标
center_x = screen_width // 2
center_y = screen_height // 2

# 将鼠标移动到屏幕中央
pyautogui.moveTo(center_x, center_y)
sleep(1)
# 在当前位置（屏幕中央）执行单击操作
pyautogui.click()

for i in range(2000):
# 获取页面总高度
page_height = driver.execute_script("return document.body.scrollHeight;")

# 获取当前滚动位置
scroll_position = driver.execute_script("return window.pageYOffset || document.documentElement.scrollTop;")

# 判断是否滑动到底部
if scroll_position >= page_height - 755:
   print("已经滑动到底部")
   break
else:
   print("还未滑动到底部")

# 模拟按下向下箭头键
pyautogui.press('pagedown')
sleep(2)
wait = WebDriverWait(driver, 10)# 等待10秒

# 定位页面上的所有图片元素
images = wait.until(EC.presence_of_all_elements_located((By.TAG_NAME, 'img')))

# 提取每个图片的src属性（即图片链接）
image_links =
url = []
# 打印图片链接
for link in image_links:
print(link)
print('--------------------------------------------------------------------------------------------')
text1 = input("请输入需要下载的图片链接的字符串：")
for link in image_links:
try:
   if text1 in link:
         url.append(link)
except:
   pass
for ul in url:
print(ul)
a = input("是否下载图片？(y/n)")
# 清理资源
driver.quit()

huangjinjia08 发表于 2024-3-27 13:52

感谢分享~~~~~~~~~~~~~~~~~~~~~~~~~~~~

cwwen 发表于 2024-3-27 13:52

chaoren1aa29 发表于 2024-3-27 14:15

谢谢楼主分享！

李亲顾 发表于 2024-3-27 14:33

谢谢，没有成品吗？不懂

ColaHyn666 发表于 2024-3-27 17:35

感谢分享哇呀

Respect2900 发表于 2024-3-28 10:17

太强了，向大佬学习

hllolyl 发表于 2024-3-28 12:44

不好意思Python一窍不通，看不懂

gmc333 发表于 2024-3-28 12:45

学习了，感谢分享

danyuhuanxiang 发表于 2024-3-28 15:50

感谢分享

页: [1] 2

吾爱破解 - 52pojie.cn's Archiver

提取图片链接：浏览网页，滑动到网页底部时，筛选出有用的图片链接（无下载代码）。