【python】爬取高清壁纸

zhuangping 发表于 2021-2-26 14:11

本帖最后由 zhuangping 于 2021-2-26 14:16 编辑

如有违规请删帖
该网站注册用户还有大尺度图片兄弟上车
import requests,time,random,string
from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.chrome.options import Options
urlArr = []
UrlAllArr = []
browser = webdriver.Chrome()
for x in range(1,86):
   browser.get("https://wallhaven.cc/search?q=id%3A537&categories=110&purity=100&ratios=16x9&sorting=favorites&order=desc&page="+str(x))
   time.sleep(1)
   #循环获取每一页的全部图片的页面链接
   UrlAllArr = browser.find_elements_by_xpath("/html/body/main/div/section/ul/li")
   for xx in range(1,len(UrlAllArr)+1):
            urlArr.append(browser.find_element_by_xpath("/html/body/main/div/section/ul/li["+str(xx)+"]/figure/a").get_attribute("href"))
#循环图片url数组并下载
for xxx in urlArr:
   browser.get(xxx)
   try:
            img_url = (browser.find_element_by_xpath("/html/body/main/section/div/img").get_attribute("src"))
            #截取后缀名
            img_houzhui = img_url.find('.',-6)+1
            img_houzhui_str = img_url
            #重新命名
            img_str = ''.join(random.sample(string.ascii_letters + string.digits,20))+"."+img_houzhui_str
            #下载到文件夹
            r = requests.get(img_url)
            #文件夹路径自行修改
            asd = open("C:\\Users\\my\\Desktop\\壁纸\\"+img_str,"wb").write(r.content)
            time.sleep(1)
   except:
            print("失败")
print("抓取完成")
browser.quit()

Shiliu2713 发表于 2021-2-26 14:19

wallhaven.cc的壁纸是挺丰富的，之前都是手动进取选

Andsny2 发表于 2021-2-26 14:20

赞一个！支持

13203893521 发表于 2021-2-26 14:29

破案了，抓起来

98079807 发表于 2021-2-26 14:46

能支持分类筛选吗比如选动物美女科幻等

zhuangping 发表于 2021-2-26 14:51

98079807 发表于 2021-2-26 14:46
能支持分类筛选吗比如选动物美女科幻等

先在网站上筛选想要的再取带参数的url循环就可以了

zgchenhc 发表于 2021-2-26 15:12

小白不懂，如何操作

98079807 发表于 2021-2-26 15:17

zhuangping 发表于 2021-2-26 14:51
先在网站上筛选想要的再取带参数的url循环就可以了

好的多谢了高清壁纸真是美美美啊

RobinMaas 发表于 2021-2-26 15:33

当初的2B小姐姐高清图，就是在这里找到的

zhuangping 发表于 2021-2-26 15:38

zgchenhc 发表于 2021-2-26 15:12
小白不懂，如何操作

更换代码9行的循环次数和10号的url

页: [1] 2

吾爱破解 - 52pojie.cn's Archiver

【python】爬取高清壁纸