我已经在 OS X 上安装了 Asterisk(http://www.mezzo.net/asterisk/index.html) 包含 app_swift 以及完全授权的 Cepstral 语音,使用 Swift 命令时音频非常不连贯。我的 swift.conf 如下,似乎与我遇到的每个示例都一样。
[general]
buffer_size=65535
goto_exten=no
voice=Allison
我得到的输出非常不连贯,无法使用。播放预先录制的音频文件可以正常工作。
还有其他人遇到过这个问题并找到了解决方法吗?
答案1
从 CPU 角度来看,TTS 是一个非常昂贵的进程。您在什么样的硬件上运行它?我会查看 top 的输出并查看 CPU 的负载情况。
进行 TTS 时音频断断续续通常意味着您的硬件无法保持实时音频流。
另外,如果我没记错的话,SWIFT 缓存了生成的音频,第二次会更好吗?
top
当您尝试使用 swift 时,您可以发布命令的输出吗?
答案2
我发现了一个帖子在 app_swift 中调整帧大小常量然后重新编译,似乎成功了。我从github 存储库做出所提到的改变并且效果会好得多。