本帖最后由 wushigudan 于 2020-12-13 19:09 编辑
各位大佬 求赐教 因为不懂自动定义函数调用 我知道如何爬取目录连接跟 单个目录的图片地址 但是不知道如何放到一块使用 我先把代码贴出来
[Asm] 纯文本查看 复制代码
#获取目录
import requests ,time
from bs4 import BeautifulSoup
import sys
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.75 Safari/537.36"
}
for p in range(1, 10):
url = "https://www.nvshens.org/gallery/chengshu/%s" % p + ".html"
web_data = requests.get(url=url, headers=headers)
soup = BeautifulSoup(web_data.text, 'lxml')
imgs = soup.select('div.post_entry >div.listdiv > ul >li.galleryli >div.galleryli_div >a')
for i in imgs:
link = i.get('href')
print('https://www.nvshens.org' + link)
这个为获取目录代码
输出结果如下
接下来是单个目录的图片前10页的图片地址获取
[Asm] 纯文本查看 复制代码 # 获取前十页的图片地址
import requests
from bs4 import BeautifulSoup
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.75 Safari/537.36"
}
for ii in range(1, 10):
url = "https://www.nvshens.org/g/34233/%s" % ii + ".html"
web_data = requests.get(url=url, headers=headers)
soup = BeautifulSoup(web_data.text, 'lxml')
imgs = soup.select('div.photos>div.gallery_wrapper > ul >img')
for i in imgs:
img = i.get('src')
print(img)
目录下的单个地址获取的图片链接
或许我做错了爬取方式 请大佬们帮忙看看
最后下载还没写 应该不难,新手诚心求教 麻烦各位大佬了
|