想写一个和声音有关的ai程序需要学习什么?
本帖最后由 netspirit 于 2024-6-20 00:57 编辑现在ai技术很流行的。我看网上有各种类型的ai工具。比如和语音有关的有ai变音器,ai翻唱,ai说话,ai语音识别等等。我对这些原理有点好奇。我想要学习一些这些软件的原理,然后自己再去写一些类似的软件玩一玩。
但是关于声音相关的软件我不太懂。声音相关的好像还涉及到时域和频域的转换?还有傅里叶变换啥的?这些我不太懂。
我想知道我想开发和声音相关的软件(尤其是涉及到ai的声音相关的软件),我需要学习哪些知识,特别是音频处理的知识?
需要学习什么信号与系统吗?这个好像是很复杂的一门课吧?只是想写点音频处理相关的程序应该不用学这么复杂的东西吧?
那么开发和声音,语音相关的ai程序需要学习哪些有关音频处理的知识呢?
比如想要开发一个ai变音器,ai翻唱,ai让音乐的音质变得更清晰,ai提取声音中的人声或者特定的声音,写这些软件需要学习哪些相关的知识啊?(特别是音频处理技术?) 你需要学习如何调用现成的模型和接口 只需要当api侠 你好,再见 发表于 2024-6-20 07:40
你需要学习如何调用现成的模型和接口
我想自己弄着玩玩...................{:301_1008:} netspirit 发表于 2024-6-20 08:19
我想自己弄着玩玩...................
现在国内99.99%都是调用接口,你没那money和水平搞算法,基本都是C写的,还要烧钱,需要一个团队。 {:301_993:}感觉楼上说的都没错,快则调用API,搞个十年八年的话,就自己写底层 你如果真想了解底层的话,去当当上搜下音频处理相关的书吧,比在这里问好。里面应该会有基础知识和算法。看完再决定要不要自己写。 有百度 阿里等现有AI配音的接口,调用也很方便,貌似论坛就很多这类的软件,你可以自己申请一个借口,连基本例子都有提供了,熟悉的话半天就能弄个简单的。 直接调用API需不需要花钱?谢谢 自己弄的话,建议先考个清华的研究生先吧。那个可能还比较简单