本帖最后由 Hazy 于 2022-10-2 11:10 编辑
[Python] 纯文本查看 复制代码 from bs4 import BeautifulSoup
import requests
# 发起请求
url = 'https://www.mmonly.cc/tag/qcxhlwkxww/'
resp = requests.get(url)
# 获得html
wangye = resp.content.decode('gbk')
# 使用BS4解析一下
soup = BeautifulSoup(wangye,'html.parser')
# find_all返回的永远是个数组,既然是数组,就要选择相应的元素
soup1 = soup.find_all('div',attrs={"class":'ABox'})
# 在你的代码里 soup1 是你提取出来的所有div , 所以你要去遍历soup1, 遍历每个div, 拿到a标签, 但是你只取了第一个div的a标签, 所以你只获取到了一个第一个div里的图片
for item in soup1:
soup2 = item.find_all('a')
# 拿到a标签下面的img,img里面的属性src
img_src = item.find_all('img')[0].attrs['src']
# 获得文件的名称
name = item.find_all('img')[0].attrs['alt']
# 将符号<b>和</b>删除
name = name.replace("<b>","")
name = name.replace("</b>", "")
# 访问这个路径,然后下载即可
resp = requests.get(img_src)
with open('./mp4/'+name+'.jpg','wb') as file:
file.write(resp.content)
print(img_src) |