flower0712 发表于 2019-11-21 18:47

表情包爬取秒变斗图帝

本帖最后由 flower0712 于 2019-11-21 18:53 编辑

第一次发帖


# -*- coding:utf-8 -*-
import requests
import re
import random

local=input('请输入下载位置:')
while (1):
    trouble=0
    n=random.randrange(2,1000)
    url=(r'http://www.doutula.com/photo/list/?page=%d'%n)
    result=requests.get(url).text
    pattern=re.compile('data-original="(.*?)"\salt="(.*?)"\sclass=',re.S)
    image_urls=re.findall(pattern,result)
    '''for image_url in image_urls:
      yield1 ={
            'image': image_url,
            }'''
    for image_url in image_urls:
      image_name=image_url
      image=requests.get(image_url).content
      try:
            with open(r'%s\%s'%(local,image_name+'.'+image_url.split('.')[-1]),'wb')as file:
                file.write(image)
      except:
            print('下载错误')
            trouble+=1
    print('页码%d下载完成\n下载错误%d张'%(n,trouble))
      #print(image_url)

flower0712 发表于 2019-11-21 18:49

第一次发帖代码没搞好,不好意思啊
页: [1]
查看完整版本: 表情包爬取秒变斗图帝