魏文涛 发表于 2024-1-20 15:49

微软Azure文字转语音sdk封装API【开源】

为方便Azure繁琐的环境配置和更好的调用服务,故开发此程序。
本程序仅在docker环境验证可行,如需运行在其他环境请按照Azure文档自行搭建环境。


上图为项目结构,部署时需要将config.yaml.example的文件名改为config.yaml,文件中的key,region替换为自己所申请服务的内容。


程序仅开放一个API,调用如上图,会以base64的形式返回wav音频文件,如需其他形式可自行更改代码实现。

源码:

项目源码:https://github.com/weiwentao996/speech

诺寒 发表于 2024-4-20 17:35

有没有成品

jaygny 发表于 2024-4-25 20:31

厉害,可以学习学习,

mickeyhust 发表于 2024-4-26 15:51

有没有ui,这个感觉还是不太会用

kingisme945 发表于 2024-7-19 10:28

建议:还不如直接用Python调用微软azure的api,然后让chartgpt写一个可以运行的gui界面。

thomasyang2005 发表于 2024-9-20 11:59

学习中,谢谢分享!
页: [1]
查看完整版本: 微软Azure文字转语音sdk封装API【开源】