吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 14528|回复: 496
收起左侧

[Windows] 智能离线语音输入工具CapsWriter-Offline v2.0.4(支持无限时长语音转文字+字幕转录)

    [复制链接]
心开始の未来 发表于 2025-3-19 02:16
CapsWriter-Offline请戳 作者项目地址是一款费开源且可完全离线识别的低延迟高精度可视化语音输入工具,基于年久失修的 旧项目 进行Python开发 并fork翻新改进及较多功能优化整合升级。在原版的基础上融合新增了热键操作、声音提示、云端剪贴板、语音转翻译、更直观的GUI图形设置界面以及更好的标点符号 / 语音识别引擎等功能。
此款软件算是某些必须联网调用API或付费产品的平替工具,设置更直观,无登录接口,功能无限制,可离线使用,不联网翻译,基本能满足譬如会议记录、各种有输入光标的软件包括但不限于文档类、游戏输入窗口等出于不想打字且需要来回切换中英文输入法的大部分日常场合。可 CPU 处理(兼容 Cuda 加速),支持 Win10 11 系统。近期更新,有需自取~~~


性:
1. 完全离线、无限时长、低延迟(仅针对性能较好较高的 CPU 而言)、高准确率、中英混输、简繁任意切换、自动阿拉伯数字、自动调整中英间隔、自动添加标点符号,无需二次复制剪贴。
2. 多引擎识别及文字图标声音提示:现支持 中、粤、英、日、韩 等多语种语音识别引擎输入(比旧时的 Whisper 识别更好);光标处麦克风显示录音状态而确定输入输出会发出提示音
3. 翻译功能:提供语音自动识别转离线或 DeepLX 在线翻译模式并直接输出。
4. 防干扰设计:录音时自动静音系统干扰音频,从而专注语音输入。
5. 云端协同:录音文本自动存档(按日期 / 关键词分类);文本秒传至云剪切板(即用即走,兼容 iOS 设备分享)。
6.. 转录功能:将音视频文件拖动到客户端打开,即可转录生成通用 的srt、txt等 字幕文件。
7. 热词及关键词增强功能:可以在 hot-en.txt、hot-zh.txt、 hot-rule.txt、 keywords.txt中自定义添加,客户端动态识别载入。
8. 现默认支持客户端跟随服务端自动打开,可多开亦可服务多台客户端。

●以上特性均可在设置界面或 py 配置文件中自行任意 DIY ~~~

使
详细完整说明教程请戳 > > 相关说明一览

以下仅作简明版扼要:
1. 为避免文件缺失,此处提供的是一键整合懒人包开箱即用版,已包含相关组件,无需 py 部署且不必过多折腾(而项目中为拆开版本需自行合并),解压使用前请先关掉杀软和必要时的 Windows防火墙直接解压后双击 start_server_gui.exe 运行服务端,但需等待自动加载 py 依赖环境及标点语音引擎完成会在底部提示“连接成功”字样方可开始使用(加载等待时长视电脑配置而定)
默认长按 Caps Lock 调用麦克风 录制语音松开即可识别转文字,曾经有粘贴文字记录的请先清空(随便复制一个文件即可清空剪贴板记录)。自带服务端和客户端的系统托盘,右键对应图标点QUIT可退出程序。

-------------------------------------------------------------------------------------------------------------
2. 基本快捷键操作:(以默认快捷键设置为例,但请先排除部分软件按键冲突问题)
Caps Lock :按下录音,松开识别并输入结果(类似按住说话)
Left(左) Shift  +  Caps Lock :识别后离线翻译为英文并输入
Right(右) Shift  +  Caps  Lock:识别后在线翻译(默认日文)并输入
双击 CapsLock :切换简 / 繁体语音输入
长按 CapsLock :触发原大写锁定功能

Ctrl + Alt + P :选中中文→离线译英并替换原文
Ctrl + Alt + [  :选中文本→在线翻译并替换原文
Ctrl + Alt + F :调用 Everything 搜索选中内容
Ctrl + 鼠标滚轮 :放大 / 缩小  UI 界面文字大小

拖入音视频到 client 客户端:自动转录生成SRT字幕
云贴按钮:上传文本框内容至云剪贴板(生成链接+二维码)
-------------------------------------------------------------------------------------------------------------

若需要修改相关设置,请先双击运行 edit_config_gui.exe ,比如允许多开服务端、修改端口、自定义修改为不常用的按键录音、录制内音;或关掉长按模式换为单击前后两次形式(适合较长语音)等。
修改完配置后建议直接长按保存 服务/客户端 配置并重启服务端(可在系统托盘处右击服务端图标的“Restart Client”),否则已修改的配置并不会生效。【若有不确定的选项建议勿修改,免得产生未知 bug 】


3. 设置开机自启:(非必要操作但可便于随时呼出调用未修改配置且首次使用的前提下,当然也可调用系统自带或其它软件唤起软件自启服务)
右键新建服务端 start_server_gui.exe 文件 的快捷方式文件,复制  shell:startup  此条命令到文件资源管理器的路径栏处并回车,然后将该快捷方式粘贴或移动到此目录下即可在开机时自动启动服务端和客户端。可在设置中调整为自动缩至系统托盘处。如下:
sshot-20250319-015754.png

4. 尤其是识别 人名同音字、数量词、网络热词等词语,需自行添加合适的规则到 hot-rule.txt 文件当中,否则软件会以默认自带库的字词输出。
另提一句,目录内的txt文件对应的内容可任意添加修改但不建议重命名,毕竟均与各种已编译的py配置文件息息相关,除非有能力折腾统一一致修改,否则会产生奇奇怪怪的问题 bug。

5. 将音视频文件拖动到客户端start_client_gui.exe中打开,等待自动处理即可。但转录字幕功能需在 server 服务端 加载完成后运行的情况下才可使用,否则会出现闪退不工作等问题。
默认转录之后生成的文件会跟着音视频文件的目录:
json 文件:字级时间戳;
txt 文件:分行结果;
merge.txt 文件:带标点的整段结果;
srt 文件:最常用的字幕文件(可导出 PR 剪辑类软件二次编辑)。
如果生成的字幕有微小错误,可以在分行的 txt 文件中修改,并将 txt 文件拖动到 client 客户端打开,最后自动修正其余字幕文件。
【毕竟只是程序附属的非主要小功能,其中纯中或纯英识别效果会好点,自然跟部分专业的字幕转录工具有些差距】


其余功能自行体验。。。


※已测 Win 10 LTSC 及Win 11 24H2 官方原版系统均可在飞行模式下离线正常使用并输出(如下,极限时长可自测,但其它精简类系统无法保证)~~~


PS
1. 本软件已测火绒无拦截,代码完全的透明因采用 py整合打包编译,故部分杀软纯属误报。另外,为满足本地化隐私优先、完全离线随时随地使用的需求,故软件整体本身并不会太小。担心的扔到虚拟环境运行或自行抓包软件行为验证便知,介意的勿下勿用,嫌弃的推荐删除文件目录并转用其它工具。。。
2. 处理效率及识别质量主要取决于设备CPU处理器(兼容低配)、语音输入时长、语音速度、声音环境、有无背景杂音等诸多情况,在一定条件下 CPU 越好、音频越短、语速越中等、语音越清晰准确、语种越常见自然处理效率越快且识别率越高,不排除偶尔性浮动,反之亦然。


服务面:(可任意处右键菜单复制粘贴、全选、撤销等)
sshot-20250311-115332.png

相关:(此处已改为不常用的insert [即Ins ] 键激活录音,均可自行开合任意选项)
sshot-20250318-010837-small.png sshot-20250318-011945-small.png

基本:(语音输入自动识别中粤英语模式输出,此处已省略录制音频等待时长过程,仅供参考)



(语音录制并自动识别切换为英文,翻译需要些时间,仅供参考)





1 > > 百度盘下载    gx3e
2 > > 备份盘下载

免费评分

参与人数 142吾爱币 +133 热心值 +120 收起 理由
废了我的密码 + 1 + 1 我很赞同!
黄金体验 + 1 + 1 热心回复!
pzy666 + 1 + 1 谢谢@Thanks!
xrs0922 + 1 + 1 谢谢@Thanks!
1798 + 1 + 1 谢谢@Thanks!
meng6699 + 1 + 1 我很赞同!
long8586 + 1 + 1 谢谢@Thanks!
wersen + 2 + 1 有人帮转个阿里云盘吗?
leonsaga + 1 + 1 谢谢@Thanks!
莫斯顿而 + 1 我很赞同!
xtmpip + 1 + 1 谢谢@Thanks!
hkr114514 + 1 用心讨论,共获提升!
ddlam + 1 + 1 谢谢@Thanks!
yangxiucai + 1 + 1 鼓励转贴优秀软件安全工具和文档!
reboju + 1 我很赞同!
yx69 + 1 + 1 我很赞同!
lingyun011 + 1 + 1 热心回复!
zhiyuan88890 + 1 热心回复!
jlczx + 1 + 1 谢谢@Thanks!
laishhh + 1 + 1 我很赞同!
qjz159 + 1 我很赞同!
丶丿 + 1 + 1 谢谢@Thanks!
踽踽独行 + 1 + 1 热心回复!
ijie + 1 + 1 我很赞同!
dzc999 + 1 + 1 谢谢@Thanks!
fbkmqj + 1 + 1 谢谢@Thanks!
withless + 1 谢谢@Thanks!
holong2018 + 1 + 1 谢谢@Thanks!
wangyongdesign + 1 + 1 热心回复!
ma4907758 + 1 谢谢@Thanks!
splzhk + 1 热心回复!
evalPrivateJS + 1 + 1 热心回复!
循光而行 + 2 + 1 我很赞同!
ind + 1 + 1 谢谢@Thanks!
welkin2000 + 1 谢谢@Thanks!
rt2w + 1 + 1 谢谢@Thanks!
wj18235894766 + 1 + 1 鼓励转贴优秀软件安全工具和文档!
chenzimrr + 1 + 1 谢谢@Thanks!
天天上天庭 + 1 + 1 谢谢@Thanks!
guccipig + 1 谢谢@Thanks!
usagod + 1 + 1 谢谢@Thanks!
tomanpj + 1 + 1 谢谢@Thanks!
simao241 + 1 + 1 我很赞同!
igaoyuan + 1 + 1 谢谢@Thanks!
a122414651 + 1 谢谢@Thanks!
5ren + 1 + 1 谢谢@Thanks!
fyz2007 + 1 + 1 谢谢@Thanks!
abc023119 + 1 + 1 谢谢@Thanks!
rocsheng + 1 + 1 我很赞同!
hemingwang0902 + 1 谢谢@Thanks!
浮尘晓梦 + 1 谢谢@Thanks!
娟然俊逸 + 1 + 1 我很赞同!
cheng0529 + 1 热心回复!
playx + 1 + 1 我很赞同!
xaiwant + 1 + 1 鼓励转贴优秀软件安全工具和文档!
336919 + 1 + 1 谢谢@Thanks!
Zed丶小灰狼 + 1 热心回复!
grrr_zhao + 1 + 1 谢谢@Thanks!
lclok + 1 + 1 谢谢@Thanks!
zli9988 + 1 谢谢@Thanks!
xiaofeng4929 + 1 谢谢@Thanks!
WoWoTouHeiHei + 1 + 1 好人一胎十八个
xjxlin + 1 + 1 怎么实现语音英文翻中文?
eden88888 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
mendy77777 + 1 + 1 热心回复!
meiyounaoziqaq + 1 + 1 谢谢@Thanks!
sirchin + 1 + 1 谢谢@Thanks!
05306213 + 1 + 1 我很赞同!
soenluzy + 1 + 1 谢谢@Thanks!
EDOS + 1 + 1 热心回复!
magiclyan + 1 + 1 字色太过于花里花哨,并非重点内容所需强调变色
卡拉肖克倩 + 1 + 1 我很赞同!
zjqfm + 1 已经处理,感谢您对吾爱破解论坛的支持!
kidzgy + 1 + 1 我很赞同!
dadao815 + 1 + 1 用心讨论,共获提升!
fuxiangrong + 1 + 1 谢谢@Thanks!
陌不作声 + 1 谢谢@Thanks!
qsj521521 + 1 + 1 谢谢@Thanks!
rebirthboy + 1 我很赞同!
wzaals + 1 + 1 不明觉厉,不明觉厉呐
aaa999jiujiujiu + 1 + 1 这个真的值得试试。谢谢分享
michaelx4 + 1 + 1 谢谢@Thanks!
wczsdwczsd + 1 我很赞同!
JINVKS + 1 + 1 真的非常有用,以前就想要一个这样的
竹轩 + 1 + 1 鼓励转贴优秀软件安全工具和文档!
ppz800 + 1 + 1 我很赞同!
安道尔的鱼 + 1 + 1 我很赞同!
wjd2002 + 1 谢谢@Thanks!
lonny888 + 1 + 1 谢谢@Thanks!
Lsygood + 1 + 1 谢谢@Thanks!
yeah52 + 1 + 1 谢谢@Thanks!
fhyz + 1 + 1 谢谢@Thanks!
pickingstar + 1 + 1 谢谢@Thanks!
520521314 + 1 + 1 谢谢@Thanks!
xiaoIU + 1 谢谢@Thanks!
RobinMaas + 2 + 1 谢谢@Thanks!
ws001980 + 2 + 1 谢谢@Thanks!
5Gwifi + 1 + 1 谢谢@Thanks!
yanglinman + 1 谢谢@Thanks!
alexsanda + 1 谢谢@Thanks!

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

3031706 发表于 2025-3-20 15:02
不知道怎么使用音视频转录功能,拖到客户端就显示这个文件的路径了,然后不知道咋办
gxrdky 发表于 2025-3-19 05:50
不错的智能离线语音输入工具,谢谢版主提供!!!
andy512 发表于 2025-3-19 04:08
52PJ070 发表于 2025-3-19 04:34
支持无限时长语音转文字+字幕转录,这点就很棒了,试试看先,辛苦楼主分享!
senlly 发表于 2025-3-19 04:59
这个真的值得试试。谢谢分享
sunjiehb 发表于 2025-3-19 06:30
非常实用的宝藏软件,感谢分享
caoguoqing 发表于 2025-3-19 06:32
多谢分享,保存起来先。
shutp 发表于 2025-3-19 06:32
感谢分享
tb16056 发表于 2025-3-19 06:37
正好需要,谢谢分享……
xiaofan0101 发表于 2025-3-19 06:42
这个好,正需要这样的工具!
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2025-3-29 05:25

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表