适用于 Windows 的良好文本转语音解决方案

适用于 Windows 的良好文本转语音解决方案

我正在运行 Windows 7,我知道它能够读取我应用程序中的文本,但我正在寻找一个好的实用程序来将大块文本保存为 wav 文件或 mp3。它可能已经内置在操作系统中,但巧妙地伪装了。我知道我可以编写程序调用 API,如果还没有好的解决方案,这就是我的下一步。

我非常喜欢AT&T 系统,但它对使用生成的 MP3 有一些相当严格的限制。我想在我的播客中使用它们。

基于 Web 的也行,只要它能轻松生成相当不受限制的(公共领域或知识共享)Wav、MP3 或其他标准音频文件。当然,我更喜欢免费或开源,而不是商业的,但这不是必需的。

答案1

我试过了说话节日, 和玛丽TTS。它们大部分都能生成可理解的声音,但不太自然。即使为这些系统(例如 Mbrola、CMU Arctic)下载了额外的语音,声音也不是那么好。

伊沃纳到目前为止,我听到的声音是最好的。他们给你 30 天的免费试用期,如果你有一次性任务要做,这已经足够了。之后,他们每条语音收费 45 美元。亚马逊刚刚收购了这家公司,所以你知道它很可靠(http://www.ivona.com/us/news/amazoncom-announces-acquisition-of-ivona-software/)。

它们与微软的 SAPI 接口兼容,这意味着任何支持该接口的程序都可以使用语音(例如 Adob​​e Reader)。我一直将它们与文本转 Wav该程序非常适合将文本文件批量转换为波形文件。

编辑

实际上,我重新阅读了您的问题,我认为对于非个人用途(例如播客),IVONA 的价格可能要高得多。在这种情况下,我会建议您查看 MaryTTS。

答案2

语音通话是免费且开源的,并提供您所需要的一切。

它可以作为命令行程序运行,从文件或标准输入中读出文本。
共享库版本也已可用。

* 包含不同的声音,其特性可以改变。
* 可以将语音输出为 WAV 文件。
* 支持 SSML(语音合成标记语言)(不完整),
  以及 HTML。
* 体积小。该程序及其数据包括多种语言,
  总计约1M字节。
* 可以将文本翻译成音素代码,因此可以将其改编为前端
  另一个语音合成引擎的结束。
* 可能支持其他语言。不同阶段包含多种语言
  进步。来自这些或其他语言的母语人士的帮助是
  欢迎。
* 可用于生成和调整音素数据的开发工具。
* 用 C++ 编写。

相关内容