吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 5926|回复: 6
收起左侧

[Python 转载] 开源,一款百度图片下载器,图片合成器。供新手学习使用

[复制链接]
井右寺 发表于 2019-8-27 10:28
成品请见https://www.52pojie.cn/thread-1012450-1-1.html
初学的时候写的东西,稍稍整理了一下。发出来供大家参考。(辟邪:大佬勿喷!)
因为感觉会是很好地练手项目,基本上全是基础知识。
另外,因为发布以后,发现很多BUG,但是最近被别的项目缠住了。
所以,开源出来,抓壮丁呀,谁把它完善了哈,毕竟学习还是要实战项目的嘛,这就是个不容错过的机会哦,基本上学习1个月左右就会接触到里面所有的知识点,练手绝佳哈。
todo:
1、下载器的优化,线程使用quene通信,梳理优化,能扩展其它平台最好。
2、合成器,使用聚类优化查询,想法是做一个聚类的链表。
3、图片相似度查询优化,最好能用cv2取代pil(因为自己想学opencv来着)。并且目前存在bug,内存占用过高,大量高质图片会导致溢出错误。
4、GUI优化,打算学qt库。
5、其它语言扩展(想用java来实现一遍,因为java已经被我丢得差不多了,上次我居然连java的数组都不会写了,丢人....)
[Python] 纯文本查看 复制代码
#!/usr/bin/env python3# -*- coding: utf-8 -*-

import tkinter as tk
from tkinter import messagebox
from tkinter.filedialog import askdirectory,askopenfilename
import threading, time, re, os, requests, math
from PIL import Image, ImageStat
		


def thread_run(func):
	def wraper(*args, **kwargs):
		t = threading.Thread(target=func, args=args, kwargs=kwargs)
		t.daemon = True
		t.start()

	return wraper

class ImageManager():
	def __init__(self, file=None, io=None, im=None):
		self.mean = None
		self.im = None
		self.path = None

		if file:
			if not os.path.exists(file):
				raise Exception("file not exists!")

			self.path = file
			self.im = Image.open(file)
		if im:
			self.im = im

	def getMean(self):
		if not self.mean:
			self.mean = ImageStat.Stat(self.im.convert('L')).mean[0]

		return self.mean

	def resize(self, size=(1,1)):
		return self.im.resize(size, Image.ANTIALIAS)
		#return self.im.resize(size)

class BasicFrame(object):
	"""Frame基类,实现grid方法"""
	def __init__(self, root=None, **args):
		super(BasicFrame, self).__init__()
		self.root = None
		if root:
			self.root = tk.Frame(root)
		if args and 'root' in args.keys:
			self.root = tk.Frame(args.root)

		if not self.root:
			raise Exception("no root")	

	def grid(self, row = 'default', column = 'default', **args):
		if row == 'default' or column == 'default':
			if args:
				self.root.grid(**args)
		else:
			self.root.grid(row=row, column=column)

class SearchFrame(BasicFrame):
	"""docstring for SearchFrame"""
	def __init__(self, root=None,**args):
		super(SearchFrame, self).__init__(root=root,**args)
		self.entry = tk.StringVar()
		self.cnt = 0
		self.num = tk.StringVar()
		self.num.set(200)
		self.name = 0 
		self.flag = False

		row = 0
		tk.Label(self.root, text = '关键词').grid(row = row, column = 0)
		tk.Entry(self.root, textvariable= self.entry, width = 24).grid(row = row, column = 1)
		tk.Button(self.root, text = '下载图片', command = self.serach).grid(row=row, column=2)

		row += 1
		tk.Label(self.root, text = '爬取量').grid(row = row, column = 0)
		self.button = tk.Entry(self.root, textvariable= self.num, width = 24).grid(row = row, column = 1)

	@thread_run
	def serach(self):
		_input = self.entry.get().replace(' ', '')
		try:
			num = int(self.num.get())
		except Exception as e:
			num = 0
			print(e)

		if self.flag:
			messagebox.showinfo("警告", "尚有后台下载任务进行中")
		elif _input == '' or num == 0:
			messagebox.showinfo("警告", "关键词或爬取量不能为空")
		else:
			self.entry.set('')
			self.prepare(_input)

	def prepare(self, keywords):
		self.flag = True
		self.keywords = keywords
		self.base_url = 'http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=' + self.keywords + '&pn='

		path = "%s\\%s" %(os.path.abspath('.'), keywords)
		if not os.path.exists(path):
			os.mkdir(path)

		t = 0
		self.cnt = 0
		fail = 0
		while True:
			if fail > 10:
				if self.flag:
					self.flag = False
					messagebox.showinfo("提示", "下载完成,但该词条下无足够数量图片!!!")
				return

			if (self.cnt >= int(self.num.get())):
				if self.flag:
					self.flag = False
					messagebox.showinfo("提示", "下载完成")
				return
			try:
				url = self.base_url + str(t)
				result = requests.get(url, timeout=10)
				pic_url = re.findall('"objURL":"(.*?)",', result.text, re.S)
				if len(pic_url) == 0:
					fail += 1
				else:
					self.downloadPic(result.text, path)
			except Exception as e:
				print(e)
				time.sleep(3)
			finally:
				t += 60
				time.sleep(1)

		#print("图片下载完成")

	def downloadPic(self, urls, path):
		
		# 每过三秒检查一次当前正在运行的线程数,超标则沉睡等待线程结束
		while threading.activeCount() > 200:
			print("线程超标---%s" %threading.activeCount())
			time.sleep(3)

		for url in urls:
			if url:
				self.download(url, path)

	@thread_run
	def download(self, url, path):
		try:
			if lock.acquire():
				if (self.cnt >= int(self.num.get())):
					lock.release()
					return
				self.cnt += 1
				self.name += 1
				filename = "%s\\%s_%s.%s" %(path, self.keywords, self.name, url.split('.')[-1])
				lock.release()

				res = requests.get(url, timeout=10)
				with open(filename, 'wb') as f:
					f.write(res.content)
			# 下载完后检查是否完成下载
			if lock.acquire():
				if (self.cnt >= int(self.num.get())):
					lock.release()
					if self.flag:
						self.flag = False
						messagebox.showinfo("提示", "下载完成")
				else:
					lock.release()
		except Exception as e:
			print(e)
			if lock.acquire():
				self.cnt -= 1
				lock.release()


class GenerateFrame(BasicFrame):
	"""docstring for GenerateFrame"""
	def __init__(self, root=None,**args):
		super(GenerateFrame, self).__init__(root=root,**args)
		self.path = tk.StringVar() # 用于保存输入源目录
		self.output = tk.StringVar() # 用于保存输出对象路径
		self.resources = []
		self.orign = None
		self.outim = None
		self.busy = False
		self.load = False

		self.width = tk.StringVar()
		self.row = tk.StringVar()
		self.column = tk.StringVar()
		self.images = []

		self.row.set('50')
		self.column.set('50')
		self.width.set('20')

		row = 0
		tk.Label(self.root, text = '输入源路径').grid(row = row, column = 0)
		tk.Entry(self.root, textvariable= self.path, width = 24).grid(row = row, column = 1)
		tk.Button(self.root, text = '载入输入源', command = self.setResource).grid(row=row, column=2)	

		row += 1
		tk.Label(self.root, text = '输出源路径').grid(row = row, column = 0)
		tk.Entry(self.root, textvariable= self.output, width = 24).grid(row = row, column = 1)
		tk.Button(self.root, text = '选择输出源', command = self.setOrign).grid(row=row, column=2)

		row += 1
		tk.Label(self.root, text = '图片宽度').grid(row = row, column = 0)
		tk.Entry(self.root, textvariable= self.width, width = 24).grid(row = row, column = 1)
		tk.Button(self.root, text = '生成图片', command = self.generate).grid(row=row, column=2)

		row += 1
		tk.Label(self.root, text = '图片行数').grid(row = row, column = 0)
		tk.Entry(self.root, textvariable= self.row, width = 24).grid(row = row, column = 1)
		#tk.Button(self.root, text = '保存图片', command = self.saveImg).grid(row=row, column=2)

		row += 1
		tk.Label(self.root, text = '图片列数').grid(row = row, column = 0)
		tk.Entry(self.root, textvariable= self.column, width = 24).grid(row = row, column = 1)		

	@thread_run
	def setResource(self,):
		try:
			self.load = True
			self.resources = []
			self.path.set(askdirectory(title="载入输入源"))
			self.images = self.getImages(self.path.get())
			for img in self.images:
				self.resources.append(ImageManager(img))
		except Exception as e:
			pass
		finally:
			self.load = False

	@thread_run
	def setOrign(self):
		orign = askopenfilename(title='选择输出源', filetypes=[('jpg', '*.jpg'), ('jpeg', '*.jpeg'), ('png', '*.png')])

		self.output.set(orign)

		self.orign = ImageManager(orign)

	@thread_run
	def generate(self,):
		if self.load:
			messagebox.showinfo("警告", "图片源加载尚未完成,请等待...")
			return
		if self.busy:
			messagebox.showinfo("警告", "上一个合成任务仍在进行中...")
			return
		try:
			self.busy = True
			width = int(self.column.get())
			height = int(self.row.get())
			length = int(self.width.get())

			self.outim = self.orign.resize((width*length, height*length))
			for i in range(height):
				for j in range(width):
					manager = ImageManager(im=self.outim.crop((i*length, j*length, (i+1)*length, (j+1)*length)))
					rgion = self.getMin(manager, self.resources)
					box = (i*length, j*length, (i+1)*length, (j+1)*length)
					self.outim.paste(rgion.resize((length,length)), box)

			self.saveImg()
			messagebox.showinfo("提示", "生成图片成功!!!")

		except Exception as e:
			messagebox.showinfo("提示", "生成图片失败,请重试...")
			print(e)
		finally:
			self.busy = False

	def saveImg(self,):
		if self.outim:
			self.outim.save('%s.png' %int(time.time()), quality=95)

	def getImages(self, path):
		tmp = []
		for root, dirs, files in os.walk(path):
			if files and len(files) > 0:
				for file in files:
					if 'jpg' in file or 'jpeg' in file or 'png' in file:
						tmp.append(root+'/'+file)
			if dirs and len(dirs) > 0:
				for _dir in dirs:
					tmp += self.getImages(root+'/'+_dir)

		return tmp

	def getMin(self, point, points):
		_min = points[0]
		_mean = point.getMean()
		_dis = math.fabs(_min.getMean() - _mean)
		for p in points:
			if math.fabs(p.getMean() - _mean) < _dis:
				_min = p
				_dis = math.fabs(p.getMean() - _mean)

		return _min

if __name__ == '__main__':
	lock = threading.Lock()
	root = tk.Tk()
	root.title("图片生成器")
	root.geometry('440x280+600+200')
	root.resizable(False, False)

	serach = SearchFrame(root)
	serach.grid(0,0)

	generate = GenerateFrame(root)
	generate.grid(1,0)

	tk.Label(text="created by Don").grid(row=2,column=0)

	root.mainloop()

源码如下:

免费评分

参与人数 3吾爱币 +5 热心值 +1 收起 理由
锦瑟流年 + 1 用心讨论,共获提升!
ming_2794 + 1 谢谢@Thanks!
wushaominkk + 3 + 1 鼓励转贴优秀软件安全工具和文档!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| 井右寺 发表于 2019-10-10 08:35
贾老猫 发表于 2019-10-9 16:10
我也想学学python,该如何开始呢?纯粹业余爱好。
在一个微信公众号里  每天看15分钟,看了有一个星期了。

先看基础语法,浏览完成后,就开始写代码
最开始可能会磕磕绊绊不知道怎么写
遇到不知道怎么办的就查   网上资料挺多
其实语言本身不是特别重要,掌握编程思想才是最重要的
而掌握思想,必须得上手自己撸代码
我最开始只是上菜鸟把基础语法过了一遍,再把阮一峰的教程浏览了几课。就开始动手写爬虫,对着库文档开始撸,遇到不会的马上回去翻文档,一个又一个的写,然后感觉自己有思路了,就回去看别人的代码,看看别人的风格思路,如何优雅的使用一些特性,对照修改自己的。
总而言之,动手写就是了,反正python的实现简单,基本前期的代码写出来,一个功能写完也就几十行不错了。。。。
仅局限于看的话,可能一会儿就忘了,毕竟比较抽象。
闭上的眼镜 发表于 2019-8-27 10:30
贾老猫 发表于 2019-10-9 16:10
我也想学学python,该如何开始呢?纯粹业余爱好。
在一个微信公众号里  每天看15分钟,看了有一个星期了。
贾老猫 发表于 2019-10-27 11:56
井右寺 发表于 2019-10-10 08:35
先看基础语法,浏览完成后,就开始写代码
最开始可能会磕磕绊绊不知道怎么写
遇到不知道怎么办的就查   ...

谢谢 我试试
jiejie1 发表于 2019-10-27 12:23
谢谢谢谢谢谢
此用户已封停 发表于 2020-1-11 12:27
井右寺 发表于 2019-10-10 08:35
先看基础语法,浏览完成后,就开始写代码
最开始可能会磕磕绊绊不知道怎么写
遇到不知道怎么办的就查   ...

学习了  我也想试试 作为兴趣爱好 还是不错的
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-16 19:36

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表