吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2495|回复: 9
收起左侧

[求助] 关于python语音识别转文字,如何训练模型,提高精准度?

  [复制链接]
lengkeyu 发表于 2022-12-25 18:08
关于python语音识别转文字,如何训练模型,提高精准度?
如题。最近在学习语音识别方面的知识。在语音识别方面,有很多api接口,
但是由于很多需要联网或者有使用次数限制等,只有sphinx这个支持离线,
但是使用他的库,测试语音转文本,尤其是汉语recognize_sphinx(audio, language='zh-cn')的时候,
那转化结果根本,不能看。

网上有用cmu sphinx训练的,看不是太明白,不知道论坛有没有大佬,给指导指导,谢谢!

免费评分

参与人数 1吾爱币 +1 热心值 +1 收起 理由
爱的人 + 1 + 1 我很赞同!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

萌新与小白 发表于 2022-12-26 00:35
百度的PaddlePaddle中有很多库,可以自己训练,也可以用自带的预训练模型。我在用PaddleOCR和PaddleSpeech。
爱的人 发表于 2022-12-26 07:18
建议先学习数学。就是线性代数,离散数学。还有微积分。先看特斯拉之夫在YouTube怎么教入门入门机器学习的。代码是python.  然后数学是线性代数,微积分,没了,人工智能离不开数学的,数学学的不行,训练出来的模型就会很差,
zhangting2022 发表于 2022-12-26 07:19
cheesw 发表于 2022-12-26 08:18
同楼上,飞浆语音识别还不错,你要是打算从0开始训练的话,需要先找一个合适的神经引擎算法(不知道是不是这么叫),然后自己写训练集,再洗数据,再拿一组去验证,大概是这样吗
非人工智能专业,但是最近也在准备炼丹
 楼主| lengkeyu 发表于 2022-12-26 08:55
谢谢楼上,我找找相关的资料,再测试下。
linswin 发表于 2022-12-26 10:22
萌新与小白 发表于 2022-12-26 00:35
百度的PaddlePaddle中有很多库,可以自己训练,也可以用自带的预训练模型。我在用PaddleOCR和PaddleSpeech ...

百度的库是免费的还是收费的?
萌新与小白 发表于 2022-12-26 12:33
linswin 发表于 2022-12-26 10:22
百度的库是免费的还是收费的?

我发这个开源免费,它也有收费的。
mynamej 发表于 2022-12-26 16:17
机器学习,神经网络的基础知识得学牢,sklearn和pytorch等平台也得理解透彻,才能很好的理解透语音识别模型
 楼主| lengkeyu 发表于 2022-12-27 14:58
本帖最后由 lengkeyu 于 2022-12-27 15:40 编辑

最近看了cmu sphinx的相关内容cmusphinx-zh-cn-5.2.tar,他识别英文的准确率还可以;但是识别中文的发音,这个基本不能用。
字典应该是个关键,但是看他的中文字典,里面实际上也有8-9万的字或词、短语,那么问题不是在数量上,大概是这样的:
C:\Users\PICC\Desktop\1672124068646.png
不太清楚他的规则。
按照道理说,现在计算机识别汉字发音,这个都很成熟了,应该是根据汉语字典发音来的吧;
为什么语音识别转文字,就不能按照字典发音来识别?而是建立了很复杂的逻辑或模型?
1672126783821.png
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 02:53

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表