zhuangping 发表于 2021-2-26 14:11

【python】爬取高清壁纸

本帖最后由 zhuangping 于 2021-2-26 14:16 编辑

如有违规请删帖
该网站注册用户还有大尺度图片 兄弟上车
import requests,time,random,string
from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.chrome.options import Options
urlArr = []
UrlAllArr = []
browser = webdriver.Chrome()
for x in range(1,86):
      browser.get("https://wallhaven.cc/search?q=id%3A537&categories=110&purity=100&ratios=16x9&sorting=favorites&order=desc&page="+str(x))
      time.sleep(1)
      #循环获取每一页的全部图片的页面链接
      UrlAllArr = browser.find_elements_by_xpath("/html/body/main/div/section/ul/li")
      for xx in range(1,len(UrlAllArr)+1):
                urlArr.append(browser.find_element_by_xpath("/html/body/main/div/section/ul/li["+str(xx)+"]/figure/a").get_attribute("href"))
#循环图片url数组并下载
for xxx in urlArr:
      browser.get(xxx)
      try:
                img_url = (browser.find_element_by_xpath("/html/body/main/section/div/img").get_attribute("src"))
                #截取后缀名
                img_houzhui = img_url.find('.',-6)+1
                img_houzhui_str = img_url
                #重新命名
                img_str = ''.join(random.sample(string.ascii_letters + string.digits,20))+"."+img_houzhui_str
                #下载到文件夹
                r = requests.get(img_url)
                #文件夹路径自行修改
                asd = open("C:\\Users\\my\\Desktop\\壁纸\\"+img_str,"wb").write(r.content)
                time.sleep(1)      
      except:
                print("失败")
print("抓取完成")
browser.quit()

Shiliu2713 发表于 2021-2-26 14:19

wallhaven.cc的壁纸是挺丰富的, 之前都是手动进取选

Andsny2 发表于 2021-2-26 14:20

赞一个!支持

13203893521 发表于 2021-2-26 14:29

破案了,抓起来

98079807 发表于 2021-2-26 14:46

能支持 分类筛选吗比如选动物美女 科幻 等

zhuangping 发表于 2021-2-26 14:51

98079807 发表于 2021-2-26 14:46
能支持 分类筛选吗比如选动物美女 科幻 等

先在网站上筛选想要的 再取带参数的url循环就可以了

zgchenhc 发表于 2021-2-26 15:12

小白不懂,如何操作

98079807 发表于 2021-2-26 15:17

zhuangping 发表于 2021-2-26 14:51
先在网站上筛选想要的 再取带参数的url循环就可以了

好的 多谢了高清壁纸真是美 美 美啊

RobinMaas 发表于 2021-2-26 15:33

当初的2B小姐姐高清图,就是在这里找到的

zhuangping 发表于 2021-2-26 15:38

zgchenhc 发表于 2021-2-26 15:12
小白不懂,如何操作

更换代码9行的循环次数和10号的url
页: [1] 2
查看完整版本: 【python】爬取高清壁纸