python爬虫下载网页图片简例
本帖最后由 liyitong 于 2022-4-7 18:42 编辑import requests
from bs4 import BeautifulSoup as bsp
url=r'https://www.mlito.com/photo/girl/g_model/121112.html'
headers={"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:86.0) Gecko/20100101 Firefox/86.0"}
xiangying=requests.get(url=url, headers=headers)
soup=bsp(xiangying.content.decode('utf-8'), 'lxml')
imgs=soup.find_all('img')
def xiazai(img):
print("开始下载图片: %s"% img.split(r'/')[-1])
try:
pic=requests.get(img, timeout =100)
except requests.exceptions.InvalidURL:
print("无法下载")
fp=open(img.split(r'/')[-1], 'wb') #文件名
fp.write(pic.content)
fp.close()
print("下载成功")
for i in imgs:
i=str(i)
if "alignnone" in i:
kaishi= i.find("src")+5 #src=" 一共5个字符
jieshu= i.find("jpg")+3 #jpg一共3个字符
img= i
xiazai(img.replace('///', '//')) #网页本身用了http:///浏览器有自动纠错显示,但是爬虫没有
执行结果:
开始下载图片: 38-1.jpg
下载成功
开始下载图片: 40-1.jpg
下载成功
开始下载图片: 41.jpg
下载成功
开始下载图片: 42.jpg
下载成功
开始下载图片: 43.jpg
下载成功
开始下载图片: 44.jpg
下载成功
开始下载图片: 45.jpg
下载成功
开始下载图片: 46.jpg
下载成功
开始下载图片: 47.jpg
下载成功
开始下载图片: 48.jpg
下载成功
开始下载图片: 49.jpg
下载成功
开始下载图片: 50.jpg
下载成功
开始下载图片: 51.jpg
下载成功
开始下载图片: 52.jpg
下载成功
开始下载图片: 53.jpg
下载成功
开始下载图片: 54.jpg
下载成功
开始下载图片: 55.jpg
下载成功
开始下载图片: 56.jpg
下载成功
开始下载图片: 57.jpg
下载成功
开始下载图片: 58.jpg
下载成功
开始下载图片: 59.jpg
下载成功
开始下载图片: 38-1.jpg
下载成功
开始下载图片: 40-1.jpg
下载成功
开始下载图片: 41.jpg
下载成功
开始下载图片: 42.jpg
下载成功
开始下载图片: 43.jpg
下载成功
开始下载图片: 44.jpg
下载成功
开始下载图片: 45.jpg
下载成功
开始下载图片: 46.jpg
下载成功
开始下载图片: 47.jpg
下载成功
开始下载图片: 48.jpg
下载成功
开始下载图片: 49.jpg
下载成功
开始下载图片: 50.jpg
下载成功
开始下载图片: 51.jpg
下载成功
开始下载图片: 52.jpg
下载成功
开始下载图片: 53.jpg
下载成功
开始下载图片: 54.jpg
下载成功
开始下载图片: 55.jpg
下载成功
开始下载图片: 56.jpg
下载成功
开始下载图片: 57.jpg
下载成功
开始下载图片: 58.jpg
下载成功
开始下载图片: 59.jpg
下载成功
代码和图:
https://liyitong.lanzout.com/ihH9k02s922j
感谢分享,谢谢。 老司机 前来报到!!! 新手学习中! 有成品吗观摩一下 李佑辰 发表于 2022-4-6 17:06
老司机 前来报到!!!
你还是安心做红包封面吧 有成品 下载 链接不 围观中,继续期待 20215031212 发表于 2022-4-6 18:34
有成品吗观摩一下
这还要什么成品?复制到python里面跑一下就OK了—— 学习了,图片好评!
页:
[1]
2