调用百度api实现ocr识别整理错

slofLeo · 发表于 2019-4-12 08:03

本帖最后由 slofLeo 于 2019-5-18 00:26 编辑

应网友要求，把代码放上了，自己去配置文件改api参数吧。小白首次发帖，大神轻喷。
最近给孩子整理错题，发现手抄，键盘输入等都效率太低，网上找了几个错题整理的APP，也不是很满意，不是识别较差就是不能修改，要不就要先买个会员。再说手机拍照后还要涂涂抹抹，用手机修改题目也不太方便。没办法，现学现卖，网上查了几天资料，拼凑了一段代码，初步实现了功能。
目前整理错题流程如下：手机拍照，用微信或QQ批量传到电脑上，然后打开图片，运行程序，选择区域，识别后自动写到result.txt中，然后再对照图片修改识别错误，保存，下一张图片，再识别，然后回到Notepad++，提示文件已被修改，自动重新打开，再修改错误，依次循环。最后复制到word中查找替换，简单排版。感觉效率还可以接受。如果有更有效的方法还请大家教我。

使用python3.7实现的，用了tkinter做的界面，需要PIL库和百度api，原谅我不厚道的在帖子代码中去掉了我的api-key，附件里的py文件中有，欢迎土豪打赏。
打开百度AI开放平台，进入控制台中的文字识别应用(需要有百度账号）。创建一个应用，并进入管理应用，记下 AppID, API Key, Secrect Key，调用 API需用到。最后安装 python 的百度ai接口的的库。
pip install baidu-aip
QQ截图20190412075448.png

[Python] 纯文本查看 复制代码

import tkinter
import tkinter.filedialog
import os
from PIL import ImageGrab
from time import sleep
from aip import AipOcr
from os import path


root = tkinter.Tk()

#设置窗口大小与位置
root.geometry('100x40+1000+300')
#设置窗口大小不可改变
root.resizable(False, False)

def baiduOCR(picfile,outfile='result.txt'):
    """利用百度api识别文本，并保存提取的文字
    picfile:    图片文件名
    outfile:    输出文件,默认result.txt
    """
    filename = path.basename(picfile)
    
    APP_ID = '你的AppID' # 你的AppID
    API_KEY = '你的API Key'  # 你的API Key
    SECRECT_KEY = '你的Secret Key'  # 你的Secret Key
    client = AipOcr(APP_ID, API_KEY, SECRECT_KEY)
    
    i = open(picfile, 'rb')
    img = i.read()
    print("正在识别图片：\t" + filename)
    """ 可选参数,可识别旋转的图像 """
    options = {}
    options["detect_direction"] = "true"
    message = client.basicGeneral(img, options)   # 通用文字识别
    # message = client.basicAccurate(img, options)   # 通用文字高精度识别
    print("识别成功！")
    i.close()
 
    with open(outfile, 'a+') as fo:
        # fo.writelines("+" * 60 + '\n')
        # fo.writelines("识别图片：\t" + filename + "\n" * 2)
        # fo.writelines("文本内容：\n")
        # 输出文本内容
        for text in message.get('words_result'):
            fo.writelines(text.get('words') + '\n')
        fo.writelines('\n')
    print("文本导出成功！")

#用来显示全屏幕截图并响应二次截图的窗口类
class MyCapture:
    def __init__(self, png):
        #变量X和Y用来记录鼠标左键按下的位置
        self.X = tkinter.IntVar(value=0)
        self.Y = tkinter.IntVar(value=0)
        #屏幕尺寸
        screenWidth = root.winfo_screenwidth()
        screenHeight = root.winfo_screenheight()
        #创建顶级组件容器
        self.top = tkinter.Toplevel(root, width=screenWidth, height=screenHeight)
        #不显示最大化、最小化按钮
        self.top.overrideredirect(True)
        self.canvas = tkinter.Canvas(self.top,bg='white', width=screenWidth, height=screenHeight)
        #显示全屏截图，在全屏截图上进行区域截图
        self.image = tkinter.PhotoImage(file=png)
        self.canvas.create_image(screenWidth//2, screenHeight//2, image=self.image)
        #鼠标左键按下的位置
        def onLeftButtonDown(event):
            self.X.set(event.x)
            self.Y.set(event.y)
            #开始截图
            self.sel = True
        self.canvas.bind('<Button-1>', onLeftButtonDown)
        #鼠标左键移动，显示选取的区域
        def onLeftButtonMove(event):
            if not self.sel:
                return
            global lastDraw
            try:
                #删除刚画完的图形，要不然鼠标移动的时候是黑乎乎的一片矩形
                self.canvas.delete(lastDraw)
            except Exception as e:
                pass
            lastDraw = self.canvas.create_rectangle(self.X.get(), self.Y.get(), event.x, event.y, outline='black')
        self.canvas.bind('<B1-Motion>', onLeftButtonMove)
        #获取鼠标左键抬起的位置，保存区域截图
        def onLeftButtonUp(event):
            self.sel = False
            try:
                self.canvas.delete(lastDraw)
            except Exception as e:
                pass
            sleep(0.1)
            #考虑鼠标左键从右下方按下而从左上方抬起的截图
            left, right = sorted([self.X.get(), event.x])
            top, bottom = sorted([self.Y.get(), event.y])
            pic = ImageGrab.grab((left+1, top+1, right, bottom))
            fileName = 'tmp2.png'
            if fileName:
                pic.save(fileName)
            print("图片识别...")
            baiduOCR(fileName)
            sleep(0.1)
            os.remove(fileName)
            #关闭当前窗口
            self.top.destroy()
        self.canvas.bind('<ButtonRelease-1>', onLeftButtonUp)
        #让canvas充满窗口，并随窗口自动适应大小
        self.canvas.pack(fill=tkinter.BOTH, expand=tkinter.YES)
 #开始截图
def buttonCaptureClick():
    #最小化主窗口
    root.state('icon')
    sleep(0.2)
    filename = 'temp.png'
    #grab()方法默认对全屏幕进行截图
    im = ImageGrab.grab()
    im.save(filename)
    im.close()
    #显示全屏幕截图
    w = MyCapture(filename)
    buttonCapture.wait_window(w.top)
    #截图结束，恢复主窗口，并删除临时的全屏幕截图文件
    root.state('normal')
    os.remove(filename)
buttonCapture = tkinter.Button(root, text='截图识别', command=buttonCaptureClick)
buttonCapture.place(x=10, y=10, width=80, height=20)
#启动消息主循环
root.mainloop()

土豪专用链接：

扫题助手v0.1.rar (2.24 KB, 下载次数: 112)

扫题助手0.5源码.rar (3.79 KB, 下载次数: 83)

slofLeo · 发表于 2020-7-17 19:19

psp7456 发表于 2020-7-17 09:49
谢谢分享，效果还是不错的，python唯一可惜的就是发布的exe文件太大了。

文件大是解释型语言的通病，因为要打包解释器。免费评分来一波呗

slofLeo · 发表于 2019-4-23 22:48

本帖最后由 slofLeo 于 2019-5-16 01:15 编辑

费了半天力气，添加了几个选项，总算打包成独立的exe文件了，就是修改config.ini文件的时候注意选择编辑器，保持为utf-8。没有什么容错机制，大家将就一下吧。
QQ截图20190423224536.png

再来个操作的截图

还希望下载的朋友给个免费的好评。
链接:
https://pan.baidu.com/s/1xF3IJOrcxvCoXx0RjtV2lg 提取码:4ar3 复制这段内容后打开百度网盘手机App，操作更方便哦

如南风过境z · 发表于 2019-4-24 07:53

来学习学习，感谢分享

k26835 · 发表于 2019-4-24 08:11

过来看看，多谢分享

xiaohuohuo · 发表于 2019-4-24 08:16

厉害，值得学习

newbie2019 · 发表于 2019-5-5 12:06

亲测好用，喜欢这种实用AI小工具，感谢楼主分享！给你评分啦。

newbie2019 · 发表于 2019-5-5 12:09

slofLeo 发表于 2019-4-23 22:48
费了半天力气，添加了几个选项，总算打包成独立的exe文件了，就是修改config.ini文件的时候注意选择编辑器 ...

楼主大大，链接失效了，能更新一下链接吗？更新版没有下载到。已给你评分和好评的小白

slofLeo · 发表于 2019-5-7 06:07

newbie2019 发表于 2019-5-5 12:09
楼主大大，链接失效了，能更新一下链接吗？更新版没有下载到。已给你评分和好评的小白

2楼已经更新了。

qflikeit · 发表于 2019-5-7 08:10

厉害，值得学习

newbie2019 · 发表于 2019-5-7 09:39

slofLeo 发表于 2019-5-7 06:07
2楼已经更新了。

非常感谢大大更新链接！请问可以提供0.5版的源码文件吗？以便好好学习一下。

帐号		自动登录	找回密码
密码			注册[Register]

[Python 转载] 调用百度api实现ocr识别整理错

免费评分

本帖被以下淘专辑推荐:

免费评分