文本批量微软语音

kekege1828 · 发表于 2022-7-25 13:05

本帖最后由 kekege1828 于 2022-9-15 13:57 编辑

首次发贴，如有违规，请版主指正

为喜欢听书的朋友尽一份薄力。

补充自大神的微软语音项目https://github.com/skygongque/tts，不过它最多生成10分钟的音频，大概2500字，对于大的文本就要想办法分割再识别，我就把狗尾续貂，增加了这部分的功能。
原贴地址：https://www.52pojie.cn/forum.php?mod=viewthread&tid=1602203

1.安装python，下载https://github.com/skygongque/tts的项目。
2.cmd中安装python库
pip install requests==2.15.1
pip install websockets==10.2
3.解压下载文件，在tts-main\python_cli_demo下建立snd和txt两个文件夹。
4.把要转换的文本文件复制到tts-main\python_cli_demo下，注意编码要是ansi，utf-8的我没研究出来，这里我把原来的tts.py编码选项改了下才能用，有兴趣的可以深入研究下。
def get_SSML(path):
with open(path,'r',encoding='utf-8') as f:
return f.read()
我试的是把原文件中的,encoding='utf-8'删去才能用。
3.把getxt.py同样复制到tts-main\python_cli_demo下。
location='G:\\D\\tts-main\\python_cli_demo\\'，这里目录改成你的，注意为\\。
里面默认是晓秋的声音，可在geTxt(input('BOOK:'),2333,3,'zh-CN-XiaoqiuNeural')中改参数。
各朗读人及效果参见https://www.bilibili.com/video/BV1Ua411p7Xh?spm_id_from=333.999.0.0&vd_source=68f4b4a96c3c24c71d90a9c596506b64
2333是分割字数，3是生成的xml后缀数字位数，zh-CN-XiaoqiuNeural是朗读人的名字，可修改。
4.在tts-main\python_cli_demo下cmd中执行python getxt.py，输入文本文件名(不含txt)。
在txt中会生成分割后的xml文件，在tts-main\python_cli_demo会生成start.bat文件，会自已运行。
5.稍等在snd文件夹中就会生成声音了，2333个字符一段，大概8分多钟。【新更新的试了下字数不要太多1000多字可以，2000多会有问题】
再次执行上述操作会删除snd和txt文件夹中文件，请生成后及时移走。

演示：
https://www.bilibili.com/video/BV1Va411u7WM/?vd_source=68f4b4a96c3c24c71d90a9c596506b64

下载：
链接: https://pan.baidu.com/s/1aQ5gYhF5pfjNhmKBhjppyw 提取码: 52pj 复制这段内容后打开百度网盘手机App，操作更方便哦

运行界面

getxt.rar (1.09 KB, 下载次数: 125)

yishenggxh · 发表于 2022-7-25 14:37

zHiHz 发表于 2022-7-25 14:31
第一次回复，好紧张啊！有没有潜规则？用不用脱啊？该怎样说啊？打多少字才显的有文采啊？我写的这么好会 ...

zHiHz · 发表于 2022-7-25 14:31

第一次回复，好紧张啊！有没有潜规则？用不用脱啊？该怎样说啊？打多少字才显的有文采啊？我写的这么好会不会太招遥？写的这么深奥别人会不会看不懂啊？好激动啊！怎样才能装成是经常回复的样貌？好紧张啊！

ltxlouis · 发表于 2022-7-25 13:25

谢谢分享

whoareu · 发表于 2022-7-25 13:40

谢谢楼主

sandon · 发表于 2022-7-25 14:03

谢谢楼主

kekege1828 · 发表于 2022-7-25 14:06

生成的效果

狂侠先森 · 发表于 2022-7-25 14:14

666 支持一波

会成功的人 · 发表于 2022-7-25 14:18

谢谢楼主分享。

LIN159155 · 发表于 2022-7-25 14:22

看看，学习学习

papercut_lp · 发表于 2022-7-25 14:26

看看，学习学习

liuwl123 · 发表于 2022-7-25 14:28

谢谢楼主

帐号		自动登录	找回密码
密码			注册[Register]

[Python 转载] 文本批量微软语音

免费评分

免费评分