吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 34363|回复: 137
收起左侧

[原创工具] 批量识别图片转文字[AHKORC]——2019.1.30更新v1.09:与1.08共存,最终版。

    [复制链接]
0772boy 发表于 2019-1-14 18:44
本帖最后由 0772boy 于 2019-1-30 21:03 编辑

由于领导需求,用AHK写了这么一个东西,无GUI,任务栏右下角会有图标,运行时会有操作提示。

v1.08以及之前的版本原理是调用windows自带的certutil.exe将图片编码保存在txt文件中,然后从txt文件里读取再post给百度API获取识别结果

v1.09原生自带Base64编码功能。

图片支持3种格式:jpg,png,bmp,支持的图片大小为:base64编码后小于4M,分辨率不高于4096*4096(从百度官网复制过来的),只作为提示,本程序内不做限制,请自行控制图片大小;

默认提供的token有效期30天(配置文件中的id和secret并不是真实可用的,可以自己申请之后填上去),过期自行更换(毕竟百度分配个人免费额度就50000次,感觉好像知道为什么别的大佬都做截图识别,不做这个批量转换的功能了);

工具会依次读取img目录中所有的图片(jpg,png,bmp)并识别保存到text中,识别图片数量没有限制,img文件夹中有多少符合要求的图片就识别多少。

参数设置在Cfgdat中的:
id,secret,token可自行更换;
保留换行=1的时候会将图片识别结果中的换行符保留,保留换行=0的时候会将图片识别结果中所有换行符去掉;
mute=1该设置为每完成多少张图片弹出一次提示,设置mute=N(正整数)时每完成N张图片弹出一次提示,设置mute=0时只在最后全部完成才弹出提示;
v1.08中basexe=certutil.exe 勿改,v1.09中无此设置
刚运行的提示:
100.jpg

帮助信息:
101.jpg


识别结果:
103.jpg
102.jpg


2019.1.22更新v1.08 最终版
修复了1.07的某个bug,未作功能调整,此版本为最终版本。

2019.1.30更新v1.09 共存
v1.09与v1.08共存,两者的区别:
1.08使用系统自带的certutil.exe对图片进行Base64编码,虽然受系统限制但是处理图片速度更快,每处理一张图片会闪过一个cmd的黑框
1.09原生自带Base64编码功能,虽然不受系统限制但是处理图片速度稍慢,不再调用certutil.exe所以不会闪黑框


感谢支持

PS:目前功能写的比较简陋,跟大佬还是有差距的,交留学习,不喜勿喷。

好像不准刮刮乐,那就各位麻烦用得上的请不要吝啬
——评分——热心——

谢谢大家

链接: https://pan.baidu.com/s/1iswRJKor4MaWAokcqx15pw
提取码: j83j

免费评分

参与人数 59吾爱币 +58 热心值 +56 收起 理由
桃花庵 + 1 + 1 我很赞同!
wilyn + 1 + 1 鼓励转贴优秀软件安全工具和文档!
我叫张晓明 + 1 谢谢@Thanks!
sdzjoy + 1 + 1 热心回复!
lonlyhappy + 1 + 1 热心回复!
林中显鹿 + 1 + 1 谢谢大佬,解了燃眉之急
您辛苦了 + 1 + 1 我很赞同!
cathxc + 1 + 1 我很赞同!
zylmp + 1 + 1 神器!!!太牛了
fishsummer810 + 1 这是个神器啊!!!!!
liye2017 + 1 + 1 我很赞同!
lf2louis + 1 + 1 我很赞同!
pheshanyun + 1 + 1 我很赞同!
lambkincc + 1 + 1 我很赞同!
水晶海洋 + 1 + 1 谢谢@Thanks!
该用户不想起名 + 1 + 1 我很赞同!
小白吃西瓜 + 1 + 1 谢谢@Thanks!
xiix112 + 1 + 1 我很赞同!
cures + 1 + 1 谢谢@Thanks!
nnwza1 + 1 + 1 谢谢@Thanks!
pa2k8 + 1 + 1 谢谢@Thanks!
langke133 + 1 + 1 谢谢@Thanks!
风云起舞 + 1 + 1 我很赞同!
abs + 1 + 1 可以做个几百页的PDF中的文字识别成TXT的工具么?
乐天骥 + 1 + 1 谢谢@Thanks!
左耀 + 1 + 1 谢谢@Thanks!
ljjwyq + 1 + 1 谢谢@Thanks!
xoverx + 1 + 1 我很赞同!
QQ1162 + 1 + 1 我很赞同!
略略略666 + 1 + 1 更新频率极高,要不我等你多更几回再下载
wdpfox + 1 + 1 谢谢@Thanks!
xiatiandegushi + 1 热心回复!
52tc007 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
越狱兔 + 1 我很赞同!
139066333 + 1 + 1 我很赞同!
qazx5555 + 1 + 1 谢谢@Thanks!
Tauch + 1 用心讨论,共获提升!
liudejun + 1 + 1 用心讨论,共获提升!
xiaoguoan111 + 1 + 1 鼓励转贴优秀软件安全工具和文档!
SCV + 1 + 1 鼓励转贴优秀软件安全工具和文档!
夏夜吉他 + 1 + 1 谢谢@Thanks!
speed2017 + 1 + 1 谢谢@Thanks!
lyinga + 1 + 1 谢谢@Thanks!
w21051103 + 1 + 1 谢谢@Thanks!
oevans2010 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
scbyjfc + 1 热心回复!
八爪印 + 1 + 1 我很赞同!
1358582642 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
幻幻乐 + 1 热心回复!
居高不下 + 1 + 1 谢谢@Thanks!
wws + 1 + 1 谢谢@Thanks!
★天若有情★ + 1 + 1 我很赞同!
xpql + 1 + 1 一切从粗糙开始
云在天 + 6 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
zhangdashan391 + 1 热心回复!
聊无知己 + 1 + 1 我很赞同!
我吃臊子面 + 1 + 1 谢谢@Thanks!
zhanglei1371 + 1 + 1 我很赞同!
zhaolisheng + 1 + 1 热心回复!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| 0772boy 发表于 2019-3-13 15:21
本帖最后由 0772boy 于 2019-3-28 10:46 编辑
bluelighting 发表于 2019-3-11 16:37
Access token expired
转化文字显示这个怎么解决?

更新一下token

123.png
 楼主| 0772boy 发表于 2019-3-28 17:17
本帖最后由 0772boy 于 2019-3-28 17:21 编辑

887677618 发表于 2019-3-28 13:47
Error: Invalid lescape



额。。首先检查网络是否畅通,然后:

你是用的什么版本?
共享里有两个版本,你要不两个都试试?

以及用的什么系统?
我测试的系统有32位win10和64位win7,其他系统没试过,你如果有条件的话可以换个不同系统的电脑试试?

下载的东西都完整吗,压缩包里面的东西都要解压出来哦,还有不要放在有中文路径的文件夹里运行。

还有我测试环境里只有Windows Defender,其他杀毒软件或者什么管家什么的不知道会不会干扰,如果实在不行就关闭所有杀毒和管家以及防火墙再试= =

再不行的话,我也没辙了。
abs 发表于 2019-1-31 20:39
0772boy 发表于 2019-1-31 16:00
几百页的PDF中提取图片的方法:
可以先把PDF分割为100页一个的PDF,然后用工具转换为Docx,然后把docx的 ...

呃,是个办法,谢谢。。但太费周折了,转化为DOCX也要等很久。
原来是用pdfelement来识别的,但有的扫描PDF文件到了100多页后,后面的就识别不出来,空白的。以前也没想到要分割成几份来分别处理。
Koony25 发表于 2019-1-14 18:49
前排顶起来哈哈哈哈哈
WUAIPOJIE2018 发表于 2019-1-14 19:02 来自手机
谢谢分享
guyun 发表于 2019-1-14 19:28 来自手机
真的是办公神器啊!果断收藏,感谢分享!
liudejun 发表于 2019-1-14 19:29
支持了,挺好的
大鲸鱼仙人 发表于 2019-1-14 19:32
这个对会议纪要有用,试一下
策士 发表于 2019-1-14 19:44
没分了,明天来给加,谢谢
qazx5555 发表于 2019-1-14 19:47
谢了
谢谢分享
zhenxinzhen 发表于 2019-1-14 20:14
支持原创
jokerlsy 发表于 2019-1-14 20:28
收藏一下,也许用的上
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 17:30

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表