liyitong 发表于 2022-4-6 16:52

python爬虫下载网页图片简例

本帖最后由 liyitong 于 2022-4-7 18:42 编辑

import requests
from bs4 import BeautifulSoup as bsp
url=r'https://www.mlito.com/photo/girl/g_model/121112.html'
headers={"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:86.0) Gecko/20100101 Firefox/86.0"}
xiangying=requests.get(url=url, headers=headers)
soup=bsp(xiangying.content.decode('utf-8'), 'lxml')
imgs=soup.find_all('img')

def xiazai(img):
    print("开始下载图片: %s"% img.split(r'/')[-1])
    try:
      pic=requests.get(img, timeout =100)
    except requests.exceptions.InvalidURL:
      print("无法下载")
    fp=open(img.split(r'/')[-1], 'wb') #文件名
    fp.write(pic.content)
    fp.close()
    print("下载成功")
   
for i in imgs:
    i=str(i)
    if "alignnone" in i:
      kaishi= i.find("src")+5 #src=" 一共5个字符
      jieshu= i.find("jpg")+3 #jpg一共3个字符
      img= i
      xiazai(img.replace('///', '//')) #网页本身用了http:///浏览器有自动纠错显示,但是爬虫没有
执行结果:

开始下载图片: 38-1.jpg
下载成功
开始下载图片: 40-1.jpg
下载成功
开始下载图片: 41.jpg
下载成功
开始下载图片: 42.jpg
下载成功
开始下载图片: 43.jpg
下载成功
开始下载图片: 44.jpg
下载成功
开始下载图片: 45.jpg
下载成功
开始下载图片: 46.jpg
下载成功
开始下载图片: 47.jpg
下载成功
开始下载图片: 48.jpg
下载成功
开始下载图片: 49.jpg
下载成功
开始下载图片: 50.jpg
下载成功
开始下载图片: 51.jpg
下载成功
开始下载图片: 52.jpg
下载成功
开始下载图片: 53.jpg
下载成功
开始下载图片: 54.jpg
下载成功
开始下载图片: 55.jpg
下载成功
开始下载图片: 56.jpg
下载成功
开始下载图片: 57.jpg
下载成功
开始下载图片: 58.jpg
下载成功
开始下载图片: 59.jpg
下载成功
开始下载图片: 38-1.jpg
下载成功
开始下载图片: 40-1.jpg
下载成功
开始下载图片: 41.jpg
下载成功
开始下载图片: 42.jpg
下载成功
开始下载图片: 43.jpg
下载成功
开始下载图片: 44.jpg
下载成功
开始下载图片: 45.jpg
下载成功
开始下载图片: 46.jpg
下载成功
开始下载图片: 47.jpg
下载成功
开始下载图片: 48.jpg
下载成功
开始下载图片: 49.jpg
下载成功
开始下载图片: 50.jpg
下载成功
开始下载图片: 51.jpg
下载成功
开始下载图片: 52.jpg
下载成功
开始下载图片: 53.jpg
下载成功
开始下载图片: 54.jpg
下载成功
开始下载图片: 55.jpg
下载成功
开始下载图片: 56.jpg
下载成功
开始下载图片: 57.jpg
下载成功
开始下载图片: 58.jpg
下载成功
开始下载图片: 59.jpg
下载成功


代码和图:
https://liyitong.lanzout.com/ihH9k02s922j


星之人666 发表于 2022-4-6 16:57

感谢分享,谢谢。

李佑辰 发表于 2022-4-6 17:06

老司机 前来报到!!!

wdslr 发表于 2022-4-6 18:26

新手学习中!

20215031212 发表于 2022-4-6 18:34

有成品吗观摩一下

年轻打工人 发表于 2022-4-6 19:27

李佑辰 发表于 2022-4-6 17:06
老司机 前来报到!!!

你还是安心做红包封面吧

YH459923797 发表于 2022-4-6 22:32

有成品 下载 链接不

iceleali 发表于 2022-4-6 22:57

围观中,继续期待

liyitong 发表于 2022-4-7 08:58

20215031212 发表于 2022-4-6 18:34
有成品吗观摩一下

这还要什么成品?复制到python里面跑一下就OK了——

ensun 发表于 2022-4-7 18:06

学习了,图片好评!
页: [1] 2
查看完整版本: python爬虫下载网页图片简例