吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 26929|回复: 188
上一主题 下一主题
收起左侧

[Windows] WhisperDesktop1.8音频转文字软件【免费开源】

    [复制链接]
跳转到指定楼层
楼主
zhangrichens 发表于 2023-5-20 21:41 回帖奖励
本帖最后由 zhangrichens 于 2023-7-19 17:10 编辑

可实现本地电脑的音频转文字软件!完全免费开源!支持 Windows、macOS、Linux
(目前界面只有英文的,但支持中文的转换)

特征
  • 基于 DirectCompute 的供应商不可知的 GPGPU;该技术的另一个名称是“Direct3D 11 中的计算着色器”
  • 纯 C++ 实现,除了基本的 OS 组件外没有运行时依赖性
  • 比 OpenAI 的实现快得多。
  • 混合 F16 / F32 精度:自 D3D 版本 10.0 起,Windows [color=var(--color-accent-fg)]需要缓冲区 的支持R16_FLOAT
  • 内置性能分析器,可测量单个计算着色器的执行时间
  • 内存使用率低
  • 用于音频处理的媒体基础,支持大多数音频和视频格式(Ogg Vorbis 除外),以及大多数在 Windows 上运行的音频捕获设备(除了一些专业的,它们只实现 ASIO API [color=var(--color-accent-fg)]。
  • 用于音频捕获的语音活动检测。

使用步骤:
下载 WhisperDesktop.zip、ggml-medium 语音模型(官方那里有好多规格如图一,作者推荐1.42G这个模型,下面百度云盘下载链接)

解压WhisperDesktop.zip,打开WhisperDesktop.exe,首先选择要加载的语音模型



加载完成后,就可以进行语音转文了



转换的过程如下图:


结果以文本格式输入。


另外一个功能是允许从麦克风捕获和转录或翻译实时音频





ggml-medium 语音模型(官方):
https://huggingface.co/datasets/ggerganov/whisper.cpp/tree/main

作者推荐ggml-medium.bin(大小为 1.42GB)
链接:
https://pan.baidu.com/s/1vszwzTdPOfmd041ywbAFHQ?pwd=xnbc
提取码: xnbc

蓝奏下载(最小的体验包):https://wwnn.lanzoue.com/iZVcM0wq5lvg 密码:7go1

Whisper :开源项目(官方)
https://github.com/Const-me/Whisper

蓝奏下载 :https://wwnn.lanzoue.com/iDT010wq4q6f 密码:57ko


免费评分

参与人数 77吾爱币 +72 热心值 +67 收起 理由
lyffer + 1 + 1 我很赞同!
vcen + 1 + 1 用心讨论,共获提升!
kjwang1 + 1 + 1 用心讨论,共获提升!
kexue8 + 1 + 1 十几分钟的手机录音,用了一个多小时才完成,看来我的GPU太差了
Rosenn + 1 + 1 谢谢@Thanks!
luanshils + 3 + 1 热心回复!
vigrand + 1 请问一下large包的V1和另一个有区别吗?
aries_1010 + 1 谢谢@Thanks!
zlyok006 + 1 热心回复!
kakazwh + 1 + 1 我很赞同!
leonjk + 1 + 1 我很赞同!
hairen + 1 + 1 我很赞同!
Dall + 1 + 1 谢谢@Thanks!
水调歌头lzh + 1 谢谢@Thanks!
welkin2000 + 1 谢谢@Thanks!
liaoliutao + 1 + 1 用心讨论,共获提升!
MW2017 + 1 + 1 我很赞同!
dobestzhou + 1 对中文的支持还是弱了些,还要大量进行修改
goodfella1370 + 1 + 1 我很赞同!
copperbell + 1 我很赞同!
4Woods + 1 + 1 谢谢@Thanks!
pswmz + 1 + 1 热心回复!
wujieduyao + 1 + 1 我很赞同!
dk1996 + 1 谢谢@Thanks!
algz + 1 开源的,支持,但转换报错。runFullImpl: failed to generate timestamp to.
dddmx + 1 + 1 我很赞同!
菠萝头~ + 1 + 1 谢谢@Thanks!
tao234 + 1 + 1 谢谢@Thanks!
xhyzzzz3 + 1 我很赞同!
david003 + 1 + 1 谢谢@Thanks!
wangqw1 + 1 + 1 谢谢@Thanks!
FGH1 + 1 牛逼克拉斯
douliuyin + 1 + 1 谢谢@Thanks!
zuokanjiaobing + 1 + 1 我很赞同!
wersen + 2 + 1 谢谢@Thanks!
ByLQX + 1 + 1 我很赞同!
wnzhcm + 1 + 1 看了各位达人的讨论帖,也想试一试把电视剧火星叔叔马丁翻译一下。的
AngIos + 1 谢谢@Thanks!
gjdjjwzx + 1 + 1 我很赞同!
bbszhu + 1 + 1 谢谢@Thanks!
hchtv + 1 我很赞同!
注视 + 1 + 1 谢谢@Thanks!
lzq2802344 + 1 + 1 谢谢@Thanks!
yongqin147 + 1 + 1 谢谢@Thanks!
liling111990 + 1 热心回复!
papapo + 1 + 1 我很赞同!
Gzsod + 1 + 1 热心回复!
a521my2011 + 1 + 1 谢谢@Thanks!
清炒藕片丶 + 1 + 1 我很赞同!
chinating + 1 + 1 谢谢@Thanks!
jamessteed + 1 + 1 谢谢@Thanks!
helh0275 + 1 + 1 鼓励转贴优秀软件安全工具和文档!
mypwjcy + 1 + 1 谢谢@Thanks!
Happpiday + 1 + 1 谢谢@Thanks!
love008 + 1 + 1 谢谢@Thanks!
asxh + 1 + 1 我很赞同!
逗逼的亮仔 + 1 + 1 我很赞同!
qsj521521 + 1 + 1 谢谢@Thanks!
17730107797 + 1 + 1 我很赞同!
鱼儿雨尔 + 1 + 1 谢谢@Thanks!
kanglong + 1 谢谢@Thanks!
xhchow + 1 谢谢@Thanks!
抱薪风雪雾 + 1 + 1 谢谢@Thanks!
autumnqiu + 1 + 1 我很赞同!
lionlion + 1 + 1 我很赞同!
rodgersnow + 1 谢谢@Thanks!
chlaimmy + 1 + 1 我很赞同!
shandian281 + 1 + 1 谢谢@Thanks!
netspirit + 1 + 1 谢谢@Thanks!
Cmzlwc + 1 + 1 谢谢@Thanks!
sorryzzital + 1 + 1 谢谢@Thanks!
wrin + 1 谢谢@Thanks!
dogox + 1 + 1 我很赞同!
qq63 + 1 + 1 谢谢@Thanks!
growing88 + 1 + 1 谢谢@Thanks!
wubaochong + 1 + 1 谢谢@Thanks!
user1 + 1 + 1 厉害了,试了下,居然能识别歌词,而且准确率很高

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

来自 2#
zhangweiyi9 发表于 2023-5-20 23:51
阿里云盘分流:https://www.aliyundrive.com/s/4Q1kv3GYMWu
自解压格式。

免费评分

参与人数 6吾爱币 +4 热心值 +5 收起 理由
TobyLee + 1 + 1 谢谢@Thanks!
david003 + 1 + 1 谢谢@Thanks!
FGH1 + 1 好人。
hotdogandy + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!
aliwinner + 1 用心讨论,共获提升!
wrin + 1 + 1 谢谢@Thanks!

查看全部评分

推荐
wuan1975 发表于 2023-5-21 13:52
把本文用的模型全部转入百度网盘了,需要的请自取。
链接:https://pan.baidu.com/s/1psBcyAm0O5JygXccL7GCqA
提取码:52pj
--来自百度网盘超级会员V9的分享

免费评分

参与人数 5吾爱币 +6 热心值 +4 收起 理由
yongqi7613 + 1 + 1 谢谢@Thanks!
CXC303 + 1 + 1 谢谢@Thanks!
welkin2000 + 1 谢谢@Thanks!
fjloveayumi + 1 + 1 感谢收集,方便后人
北人无择 + 2 + 1 谢谢@Thanks!

查看全部评分

推荐
natrastyle 发表于 2023-5-21 00:03
音频文字双向转换的工具不多呀,多谢大佬推荐
推荐
 楼主| zhangrichens 发表于 2023-5-21 06:15 |楼主
user1 发表于 2023-5-20 22:24
可以支持这么多种语言,而且还带翻译?突然我有一个想法

学以致用,终于可以深刻理解影片的对话了!
推荐
wsasecy 发表于 2023-5-20 23:18
3G的模型不是更好么?不推荐只是因为体积过大?没耐心翻到作者推荐的页面文字,卤煮给个具体页面链接我看看哦~~
推荐
wmao28 发表于 2023-5-20 23:01
user1 发表于 2023-5-20 22:24
可以支持这么多种语言,而且还带翻译?突然我有一个想法

兄弟借一部说话
7#
xinda3344 发表于 2023-5-20 21:44
虽然用不上,但还是多谢分享
8#
user1 发表于 2023-5-20 22:24
可以支持这么多种语言,而且还带翻译?突然我有一个想法
9#
刘统宝 发表于 2023-5-20 23:15
今天还用了网易见外平台,有这个就方便了,试试效果
10#
shelly1314 发表于 2023-5-20 23:32
很好用的软件
11#
xuehailong 发表于 2023-5-21 00:11
超实用小工具
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-12-21 17:39

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表