本帖最后由 popolyj 于 2019-7-25 12:02 编辑
AI应用——语音合成、语音识别、文本翻译(批量合成、情景对话)【更新:2019-02-23】
本软件采用腾讯AI、百度AI开放平台的接口开发..
特别注意:
本文中提到的软件均不包含app_id和app_key,
请自行前往网站申请并配置,否则软件运行会报错!!!
更新内容:2019-07-25
1、新增保存配置、读取配置、恢复默认入口,仅支持百度的Asr
2、修复已知的一些bug,如为空的翻译,码率不对的识别错误提示
更新内容:2019-02-23
1、修复已知问题
2、本版本无新内容更新
更新内容:2019-02-22
1、新增对百度云AI的支持,支持语音识别、语音合成等功能
2、允许识别本地语音文件(WAV 16000Hz)
3、允许合成单条语音文件
4、允许批量合成语音,支持情景模式(根据自定义设置选择男生或者女生,语速,语调,音量等)
5、支持导入导出合成明细
6、支持根据合成明细逐条合成语音
7、去除腾讯Ai相关的参数设置显示项(有用户反应无法输入,原设定是显示,设置请修改xml配置文件)
启动程序前需要注意的事项:
1、请前往软件所在目录的config文件夹中,修改Cfg_AiPlat.xml
其中:
AppName=“Tts” 为语音合成(腾讯AI)
AppName=“TextTrans” 为文本翻译(腾讯AI)
AppName="BaiduAiPlat" 为语音识别合成助手(百度AI)
两者可以配置成一样,取决于你申请的应用是否训练此能力
考虑到并发的问题,故此处不提供App_Id和App_Key,请自行申请使用
腾讯AI申请地址:https://ai.qq.com/console/home/
百度AI申请地址:http://ai.baidu.com/
[XML] 纯文本查看 复制代码
<?xml version="1.0" encoding="utf-8" ?>
<Config>
<AppList>
<App AppName="Tts">
<App_Id>请修改此处为您的App_Id</App_Id>
<App_Key>请修改此处为您的Key</App_Key>
</App>
<App AppName="TextTrans">
<App_Id>请修改此处为您的App_Id</App_Id>
<App_Key>请修改此处为您的Key</App_Key>
</App>
<App AppName="BaiduAiPlat">
<App_Id>请修改此处为您的App_Id</App_Id>
<App_Key>请修改此处为您的Key</App_Key>
<Secret_Key>请修改此处为您的Secret_Key</Secret_Key>
</App>
</AppList>
</Config>
程序界面:
腾讯AI - 语音合成(Tts.exe):已解决150字节限制问题
腾讯AI - 文本翻译(TextTrans.exe):已解决1024字节限制问题
百度AI - 试音识别合成助手(Asr.exe):
1、支持语音识别
2、支持简单的语音合成
3、支持批量语音合成
4、支持逐条语音合成
5、支持导入导出带合成数据,以便修改
6、支持逐条修改合成明细
7、更多支持项请自行探索
程序下载地址(见附件):
当前版本:
Build:20190725
AI应用之语音合成、试音识别、文本翻译 20190223.rar
(517 Bytes, 下载次数: 2352)
下载地址同文档中的 20190223
已经购买可以忽略此次购买
历史版本:
Build:20190223
这个版本只是修改了一些异常,不影响使用,不介意的话,可以不用下载
这个下载地址中包含了历史所有版本,新用户可以直接下载这个文件
Build:20190222
AI应用——语音合成&试音识别&文本翻译 20190222.rar
(484 Bytes, 下载次数: 214)
Build:20190221
腾讯AI Lab应用——语音合成&文本翻译 Ver 1.0.0.rar
(296 Bytes, 下载次数: 194)
压缩包统一密码:www.52pojie.cn
刚出炉的APP,有问题请在此反馈,谢谢
常见问题列表:
1、如果遇到401未经授权的问题,问题如下图:(20190223版本中已修复)
请打开软件目录中的Config目录
对目录中的Cfg_AiPlat.xml进行配置,配制方法如下:
其中:
AppName=“Tts” 为语音合成(腾讯AI)
AppName=“TextTrans” 为文本翻译(腾讯AI)
AppName="BaiduAiPlat" 为语音识别合成助手(百度AI)
两者可以配置成一样,取决于你申请的应用是否训练此能力
考虑到并发的问题,故此处不提供App_Id和App_Key,请自行申请使用
腾讯AI申请地址:https://ai.qq.com/console/home/
百度AI申请地址:http://ai.baidu.com/
2、导入明细时,我设置了普通男生的发音,怎么导进去变成普通女声了?(20190223版本中已修复)
语音发音人这里有个小小的问题,由于我的失误将普通男声写成了普通男生,但是导入的时候识别的是普通男声,记得不要写错哟,这个问题我会在后续的优化中修正的
给大家一个场景对话的示例文件吧,也是对这个工具的一个帮助文件,需要语音的,可以自己尝试合成,或者直接在这里下载吧
语音帮助文档:
语音帮助.rar
(902.47 KB, 下载次数: 312)
[Visual Basic .NET] 纯文本查看 复制代码
发音人|发音文本
情感合成-度丫丫|逍遥,你好,听说你出新的小工具了?
情感合成-度逍遥|你好,是的,最近写了一个基于百度AI开放平台的语音识别合成助手
情感合成-度逍遥|对了丫丫,你有用过么?
情感合成-度丫丫|我刚刚从吾爱破解论坛下载了这个小工具,正准备使用呢!对了使用的时候有什么注意事项么?
情感合成-度逍遥|嗯~我想想!首先,在你启动小工具之前,请前往开放平台注册一个帐号
情感合成-度逍遥|注册的地址是:http://ai.baidu.com/
情感合成-度逍遥|然后,按照提示一步步完成注册,再来,记得要开通百度语音功能哦!
情感合成-度逍遥|开通的方法是这样的:在全部产品中选择人工智能,然后选择百度语音,打开百度语音的页面
情感合成-度逍遥|在这个页面中,创建一个应用,应用名字你自己取一个,应用分类选择工具应用,语音包名选择不需要,应用描述同应用名字,点击立即创建
情感合成-度逍遥|创建完成后,页面会跳转到应用列表,在这里你能看到AppID、API Key、Secret Key等关键要素,记得复制一份。
情感合成-度逍遥|应用创建完成了,随后,请前往小工具所在目录,找到Config文件夹
情感合成-度逍遥|在文件夹中找到Cfg_AiPlat.xml文件,用记事本打开
情感合成-度逍遥|将刚刚申请得到的关键要素,对应填写到BaiduAiPlat的对应栏位中,替换中文说明即可,不要修改配置文件的标签哦
情感合成-度逍遥|保存这个文件,再开启小工具,开始你的语音识别合成之旅吧~~
情感合成-度丫丫|好的,我试试。哇~~成功了呀!逍遥哥,再教教这个小工具要怎么用吧?
情感合成-度逍遥|恩,好的。打开小工具后,你会看到小工具分为三块,最左边是语音识别,中间是语音合成,最右边高级合成
情感合成-度逍遥|首先,我们讲讲语音识别,语音识别并不是所有的音频文件都能识别的,他需要格式为WAV、PCM、AMR文件,采样率为16000Hz
情感合成-度逍遥|需要为自然人发音,语言支持普通话近场、普通话远场、英语、粤语、四川话等,具体可以通过参数识别模型进行调整
情感合成-度逍遥|如果需要识别的音频文件比较长,需要修改识别超时时间,否则还没识别完就超时了,导致识别失败,这个超时时间同样作用于后面的语音合成和高级合成
情感合成-度丫丫|恩恩,这个会了,逍遥哥,再教教我语音合成的功能吧。
情感合成-度逍遥|好的,语音合成,顾名思义就是将文本用机器语言翻译成语音,并生成语音文件
情感合成-度逍遥|语音合成支持输出MP3、PCM 16000Hz、PCM 8000Hz、WAV 16000Hz的语音文件
情感合成-度逍遥|可以根据需要对语速、音调、音量进行个性化调整
情感合成-度逍遥|然后点击开始合成,哦,对了,打断一下,再点击之前,请务必输入输出的文件名,文件名不需要路径、不需要扩展名,请遵守Windows的文件名规范,不要输入特殊字符。
情感合成-度逍遥|一切就绪,点击后,稍等一会,这里的时间取决于你要转换的文本长度,这里文本的长度不能超过2048个字,这是接口限制的。
情感合成-度逍遥|叮!很快合成完成了!这时候,你可以在小工具的目录中找到Export目录,来寻找导出的文件,文件名就是你刚刚输入的那个
情感合成-度逍遥|另外,如果只是想试听的话,可以点击小话筒的按钮,直接在小工具中预览播放,左键点击是播放,右键点击是停止
情感合成-度逍遥|对了,语音合成功能只能合成单条语音,不能进行批量合成,需要批量合成的话,就要使用高级合成功能了,另外,刚刚的试听功能也只支持单条语音的试听哦!
情感合成-度丫丫|哇~~好期待呀,逍遥哥,我在帖子里看到有坛友询问是否能支持场景对话的功能呢?
情感合成-度逍遥|恩,在2019年02月22日更新后的版本中,加入了情景对话的功能,也就是刚刚说的高级合成啦
情感合成-度逍遥|刚刚再说语音合成的时候,我一直没有说添加到高级合成那个按钮吧,这个就是将单条语音设置成高级合成的入口之一啦
情感合成-度逍遥|在你配置完单条语音的参数后,可以通过点击这个按钮,将信息传送到合成明细中
情感合成-度逍遥|每条明细的参数是互相独立的,在传送多条后,发现集中的某一条设置有错误,可以选中这条,这条的信息就会被返显到语音合成的位置
情感合成-度逍遥|然后,你可以根据自己的需要进行修改,修改完成后,记得点击高级合成中的修改明细按钮哦,这样才算修改完成。
情感合成-度丫丫|逍遥哥,这样一条条的添加,不是很麻烦么,如果语音文本很多的话,不是要累死了。
情感合成-度逍遥|哈哈,这个呀,我早就给你想到了,你可以使用导入明细和导出明细呀,这样不就可以快速处理明细了么
情感合成-度逍遥|导入明细,支持同时导入多个明细,导入后,文件名默认为最后一个导入的文件名
情感合成-度逍遥|导入的明细文件,要注意的是,第一行为标题行,不会被导入哦,另外导入文件都格式为发音人、发音文本,两者之间用竖杠分割
情感合成-度逍遥|发音人支持项,可以参考语音发音人选项,输入对应的中文即可,注意不要输错符号和文字哟,不然是不认的哟
情感合成-度逍遥|对了,语音发音人这里有个小小的问题,由于我的失误将普通男声写成了普通男生,但是导入的时候识别的是普通男声,记得不要写错哟,这个问题我会在后续的优化中修正的
情感合成-度逍遥|通过导入的明细是不支持配置语速、音调、音量的,如果有必要修改,还是需要一条条进行修改哦。
情感合成-度逍遥|说完了导入,我们再说说导出,导出的时候,必须要在语音合成的选项中输入输出文件名,规则同语音合成,这里就不再说了
情感合成-度逍遥|导出时,会将合成明细中的发音人和发音文本注意按照顺序进行导出,同样第一行为标题行,不作为数据使用哦。
情感合成-度逍遥|导出的文件在小工具目录的Export目录中,文件名就是你刚刚输入的文件名。
情感合成-度丫丫|好的,逍遥哥哥,明细我都准备好了,我要怎么合成呢?还是点开始合成么?
情感合成-度逍遥|不不不,这里不是点开始合成了,这里分成两块,看你是需要生成多个文件还是生成一个文件
情感合成-度逍遥|需要生成多个文件的话,就点击逐个合成,需要生成一个文件的话,就点击全部合成
情感合成-度逍遥|不管点击哪一个按钮,点击后都需要等待一会,具体等待时间,还是要取决于你的明细行数啦
情感合成-度丫丫|恩恩,了解了,对了,如果我的明细行不要了,我是要重新启动软件么?
情感合成-度逍遥|这个么,看你的需求了,你可以通过单条修改,也可以选中一条,按Delete键进行逐条删除,如果是全部明细不要的话,只要点击一下清空明细就可以啦
情感合成-度丫丫|哇~这个工具听起来很好玩的样子,我要赶紧制作一个属于自己的合成音频。
情感合成-度逍遥|好的,那今天我们就先介绍到这里,你赶紧去玩吧。
情感合成-度丫丫|好的,逍遥哥再见
普通男声|逍遥哥,逍遥哥,我怎么使用软件会报401获取授权信息错误的错误呢?
情感合成-度逍遥|这个嘛~你一定是没有正确的配置配置文件啦,程序在尝试拿取授权信息的时候失败了,导致程序崩溃了,这个崩溃错误,我会在后续的优化中修正的,会给出更合理的提示信息
普通男声|好的,谢谢逍遥哥,我去试试,逍遥哥再见!
情感合成-度逍遥|恩,再见
情感合成-度逍遥|逍遥哥,在这里祝大家新年快乐,心想事成,如果还有其他问题的话,请广大坛友在相应的帖子后面留言,逍遥哥会及时给你们回复的。
情感合成-度逍遥|如果使用遇到问题,可以截图留言,并附上小工具目录中,log目录对应日期的日志文件内容贴给我,尤其是Error的文件,方便逍遥哥定为问题,谢谢。
各位,如果觉得好,给个评分呗,小弟在此先谢谢了~~
|