Umi-OCR 离线批量文字识别软件 [更新v1.3.1]

Nagisa1224 · 发表于 2022-4-18 12:11

本帖最后由 Nagisa1224 于 2022-11-4 21:35 编辑

Umi-OCR 文字识别工具

免费、开源、可批量的离线OCR软件；适用于 Windows10,11 平台。

免费：本项目所有代码开源，完全免费。
方便：解压即用，离线运行，无需网络。
批量：可批量导入处理图片，结果保存到本地 txt / md / jsonl 多种格式文件。也可以即时截屏识别。
高效：采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够，通常比在线OCR服务更快。
精准：默认使用PPOCR-v3模型库。除了能准确辨认常规文字，对手写、方向不正、杂乱背景等情景也有不错的识别率。可设置忽略区域排除水印、设置文块后处理合并排版段落，得到规整的文本。

下载

Umi-OCR 软件本体含 简体中文&英文 通用识别库。
配套 多国语言识别扩展包 可导入 繁中,英,日,韩,俄,德,法 识别库，请按需下载。

Github下载：Release v1.3.1

蓝奏云下载：https://hiroi-sora.lanzoul.com/s/umi-ocr

兼容性

系统支持 Win10 x64 及以上版本。
CPU必须具有AVX指令集。常见的家用CPU一般都满足该条件。（出现初始化引擎失败等问题时请检查CPU是否兼容，见楼下置顶回复）

简单上手

准备

下载压缩包并解压全部文件即可。

截图识别

点击截图按钮或自定义快捷键，唤起截图识别。

粘贴图片到软件

在任何地方（如文件管理器，网页，微信）复制图片，软件上点击粘贴按钮，自动识别。

批量识别本地图片文件

将图片或文件夹拖进软件，批量转换文字。也可以点击按钮打开浏览窗口导入。

文本块后处理功能

OCR识别出的文本是按“块”划分的，通常一行文字分为一块，有时还会将一行误划分为多块，这给阅读带来了不便。文本块后处理就是对文本块进行再加工的过程，合并同一行或同一段落内的文字，按正确的顺序排序。

下图表示不同排版应该选用何种处理方案：

忽略区域功能

忽略区域是本软件特色功能，可用于排除图片中水印的干扰，让识别结果只留下所需的文本。

通过设置页的 忽略区域编辑器 进入配置。

其他设置项

软件内有详尽的提示，鼠标悬停在设置项UI上即可显示提示框。

更多高级功能说明，请见项目Github页面。

更新日志

v1.3.1 `2022.11.4`

修Bug：快捷键模块重写，引入pynput库，舍弃keyboard库，解决几率失效、录制不正确等Bug。
新功能：添加开机自启，桌面快捷方式，开始菜单快捷方式。
新功能：多开软件时提示。
新功能：截图时隐藏窗口。
调整UI：使用频率极低的设置项设为隐藏的高级选项。
优化：检查引擎组件是否存在。
优化：横排-合并多行-自然段 优化逻辑，支持0~2全角空格首行缩进。

v1.3.0 `2022.9.29`

框选截屏
系统托盘图标
引擎进程常驻
文本块后处理模块
重制UI
自定义主输出栏字体
更新PaddleOCR-json模块至v1.2.1，提供剪贴板支持。
修正了Bug：系统语言兼容性问题 issue #16 。
修正了Bug：微信图片粘贴问题 issue #22 。

v1.2.6 `2022.9.1`

更新PaddleOCR-json模块至v1.2.0，提高识别速度、准确度。
调整UI：更方便地用下拉框切换识别语言。
调整UI：可以从主窗口任意位置/任意选项卡拖入图片。
修正了Bug：提高程序健壮性，增加启动子进程时的更多异常处理情况。
修正了Bug：彻底解决了对边缘过窄的图片，识别结果不准确的问题 issue #7 。
优化适配PP-OCRv3模型，彻底解决了v3版模型比v2慢、不准的问题 issue #4 。

…………

喜欢请给个⭐，谢谢支持！

https://github.com/hiroi-sora/Umi-OCR

Nagisa1224 · 发表于 2022-9-3 10:53

本帖最后由 Nagisa1224 于 2022-9-3 10:55 编辑

关于初始化失败或进程崩溃的说明：

当出现下图所示的Bug，初始化失败/进程崩溃，且 PaddleOCR-json.exe 报错 0xc000142；很可能是由您的CPU不支持AVX指令集引起。

软件的离线识别引擎依赖Opencv图像处理库，默认启用了AVX指令集加速。在CPU无avx的机器上，引擎无法加载dll完成初始化，报错0xc0000142。

当前版本对此问题无解。未来可能提供一个屏蔽AVX加速的版本的软件以供这些cpu使用。遗憾的是Opencv和Paddle官方似乎未提供 no_avx 版动态库，我需要改写源码编译它们，可能短期内无法实现。

（注：常见的家用CPU一般都支持AVX）

AVX	支持的产品系列	不支持	存疑
Intel	酷睿Core，至强Xeon	凌动Atom，安腾Itanium	赛扬Celeron，奔腾Pentium
AMD	推土机架构及之后的产品，如锐龙Ryzen、速龙Athlon、FX 等	K10架构及之前的产品

（若您的CPU支持AVX仍出现了此Bug，欢迎来告诉我。建议去Github 提 issue，52这边我不一定能及时看到。）

1qaz · 发表于 2022-4-20 20:10

本帖最后由 1qaz 于 2022-4-20 20:13 编辑

任务开始时间：2022-04-20 20:09:56

忽略区域：关闭

1.jpg

识别耗时：0.008054733276367188s 置信度：失败

识别失败，错误码：300
错误信息：向识别器进程写入图片地址失败，疑似该进程已崩溃。[Errno 22] Invalid argument

---

任务结束时间：2022-04-20 20:09:57

任务耗时（秒）：       0.019047260284423828
单张平均耗时：       0.019047260284423828
共计图片数量：       1
识别正常的图片数量： 0
未识别到文字的图片数量：0
识别失败的图片数量： 1

是什么原因？LTSC 2019 64系统

richie600 · 发表于 2022-4-21 12:51

通过别的工具先把pdf转成图片，再用此软件识别图片提取文字复制出来可算解决了能把PDF直接转成可编辑文字的word文档的免费工具太稀缺了大部分PDF转换成word后都是以图片形式呈现在word中并不能直接编辑感谢分享解决了大问题

抚琴的人 · 发表于 2022-4-18 12:20

收藏备用

wuailisure · 发表于 2022-4-18 12:21

楼主厉害

zsw555 · 发表于 2022-4-18 12:21

很实用，谢谢

lxl217114 · 发表于 2022-4-18 12:21

哇哦，看起来不错的ocr工具，收藏备用

loppol · 发表于 2022-4-18 12:28

支持一下~~~~

wl823 · 发表于 2022-4-18 12:30

好工具，就是不知道识别率高不高

李佑辰 · 发表于 2022-4-18 12:33

牛皮啊支持！！

mcang6 · 发表于 2022-4-18 12:34

一直很想找一个能批量处理的，太棒了

zztoozzt · 发表于 2022-4-18 12:35

优秀，支持一波

帐号		自动登录	找回密码
密码			注册[Register]

[原创工具] Umi-OCR 离线批量文字识别软件 [更新v1.3.1]

Umi-OCR 文字识别工具

下载

兼容性

简单上手

准备

截图识别

粘贴图片到软件

批量识别本地图片文件

文本块后处理功能

下图表示不同排版应该选用何种处理方案：

忽略区域功能

其他设置项

更新日志

v1.3.1 `2022.11.4`

v1.3.0 `2022.9.29`

v1.2.6 `2022.9.1`

喜欢请给个⭐，谢谢支持！

免费评分

本帖被以下淘专辑推荐:

关于初始化失败或进程崩溃的说明：

免费评分

浏览过的版块

[原创工具] Umi-OCR 离线批量文字识别软件 [更新v1.3.1]

Umi-OCR 文字识别工具

下载

兼容性

简单上手

准备

截图识别

粘贴图片到软件

批量识别本地图片文件

文本块后处理功能

下图表示不同排版应该选用何种处理方案：

忽略区域功能

其他设置项

更新日志

v1.3.1 2022.11.4

v1.3.0 2022.9.29

v1.2.6 2022.9.1

喜欢请给个⭐，谢谢支持！

免费评分

本帖被以下淘专辑推荐:

关于初始化失败或进程崩溃的说明：

免费评分

浏览过的版块

v1.3.1 `2022.11.4`

v1.3.0 `2022.9.29`

v1.2.6 `2022.9.1`