【python】爬取高清壁纸
本帖最后由 zhuangping 于 2021-2-26 14:16 编辑如有违规请删帖
该网站注册用户还有大尺度图片 兄弟上车
import requests,time,random,string
from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.chrome.options import Options
urlArr = []
UrlAllArr = []
browser = webdriver.Chrome()
for x in range(1,86):
browser.get("https://wallhaven.cc/search?q=id%3A537&categories=110&purity=100&ratios=16x9&sorting=favorites&order=desc&page="+str(x))
time.sleep(1)
#循环获取每一页的全部图片的页面链接
UrlAllArr = browser.find_elements_by_xpath("/html/body/main/div/section/ul/li")
for xx in range(1,len(UrlAllArr)+1):
urlArr.append(browser.find_element_by_xpath("/html/body/main/div/section/ul/li["+str(xx)+"]/figure/a").get_attribute("href"))
#循环图片url数组并下载
for xxx in urlArr:
browser.get(xxx)
try:
img_url = (browser.find_element_by_xpath("/html/body/main/section/div/img").get_attribute("src"))
#截取后缀名
img_houzhui = img_url.find('.',-6)+1
img_houzhui_str = img_url
#重新命名
img_str = ''.join(random.sample(string.ascii_letters + string.digits,20))+"."+img_houzhui_str
#下载到文件夹
r = requests.get(img_url)
#文件夹路径自行修改
asd = open("C:\\Users\\my\\Desktop\\壁纸\\"+img_str,"wb").write(r.content)
time.sleep(1)
except:
print("失败")
print("抓取完成")
browser.quit()
wallhaven.cc的壁纸是挺丰富的, 之前都是手动进取选 赞一个!支持 破案了,抓起来 能支持 分类筛选吗比如选动物美女 科幻 等
98079807 发表于 2021-2-26 14:46
能支持 分类筛选吗比如选动物美女 科幻 等
先在网站上筛选想要的 再取带参数的url循环就可以了 小白不懂,如何操作 zhuangping 发表于 2021-2-26 14:51
先在网站上筛选想要的 再取带参数的url循环就可以了
好的 多谢了高清壁纸真是美 美 美啊 当初的2B小姐姐高清图,就是在这里找到的 zgchenhc 发表于 2021-2-26 15:12
小白不懂,如何操作
更换代码9行的循环次数和10号的url
页:
[1]
2