听起来很自然的文本转语音?

听起来很自然的文本转语音?

我正在寻找一些适用于 Ubuntu 的易于安装的文本转语音软件,这些软件听起来很自然。我安装了FestivalGespeaker等等,但没有一个听起来很自然。一切都很合成,很难理解。

有没有什么建议?

答案1

SVOX pico2wave

sudo apt install libttspico-utils

非常简约的 TTS,听起来比 espeak 或 mbrola 更好(在我看来)。一些信息这里

我不明白为什么与 espeak 或 mbrola 相比,pico2wave 很少被提及。它很小,但声音非常好(自然)。无需修改,您就会听到自然的女性声音。

而且...与 Mbrola 相比,它可以识别单位并以正确的方式朗读!
例如:

  • 2°C → 2 度
  • 2米 → 2米
  • 2公斤→2公斤

安装后我在脚本中使用它:

#!/bin/bash
pico2wave -w=/tmp/test.wav "$1"
aplay /tmp/test.wav
rm /tmp/test.wav

然后使用所需的文本运行它:

<scriptname>.sh "hello world"

或者读取整个文件的内容:

<scriptname>.sh "$(cat <filename>)"

这就是在 Ubuntu 上拥有一个轻量级、稳定工作的 TTS 的全部内容。

答案2

Pico 和 espeak 很有趣,而且很容易上手,但它们并不是那么好。默认的 Festival 声音也不是那么好。然而,Festival 是一个基于方案的语音框架,许多研究人员已经构建了更好的插件声音。您可以轻松超越原版 Ubuntu 上的 pico2wave 质量,因为其中一种声音是现成的软件包。

为了让 Festival 听起来自然,请执行以下操作:

sudo apt-get install festival
sudo apt-get install festvox-us-slt-hts
festival -i
festival> (voice_cmu_us_slt_arctic_hts) 
festival> (SayText "Don't hate me, I'm just doing my job!")

您可以从命令行通过使用-b(或--batch) 并将每个命令放在单引号中来执行此操作:

festival -b '(voice_cmu_us_slt_arctic_hts)' \
    '(SayText "The temperature is 22 degrees centigrade and there is a slight breeze from the west.")'

您可以从 Nitech 存储库中获得其他相当不错的声音,但安装它们很麻烦,并且默认路径发生了变化,因此捆绑的方案文件中的文件名引用可能需要手动编辑才能在原始 Ubuntu 上运行。

答案3

说出来!

我相信我已经找到了最好的免费 TTS 软件,使用名为“SpeakIt”的 Google Chrome 扩展程序。对于我来说,这只适用于 Ubuntu 上的 Chrome 浏览器。出于某种原因,它不适用于 Chromium。SpeakIt 附带两种女性声音,与其他所有声音相比,这两种声音听起来都非常逼真。如果您使用“TTS”作为查询在 Chrome Web Store 中搜索,Chrome 扩展程序中至少列出了四种男性和女性声音。

用法:用于网站上。突出显示要阅读的文本,然后右键单击并“SpeakIt”或单击停靠在 Chrome 顶部栏上的 SpeakIt 图标。


Firefox 用户还有两个选项。在 Firefox 附加组件中,搜索 TTS你应该会找到“点击说话”和“文本转语音”。这些声音不如 Chrome SpeakIt 的声音好,但绝对可用。

SpeakIt 扩展使用 iSpeech 技术,网站每年收费 20 美元,可以将文本转换为 MP3 音频文件。您可以输入文本、URL、RSS 订阅源以及 TXT、DOC 和 PDF 等文档并输出为 MP3。您可以制作播客、嵌入音频等。以下是链接, 和他们的音频样本(不知道该链接将持续多久)。

答案4

我到处寻找适合 Ubuntu 的高质量文本转语音软件。但一无所获。我的声带瘫痪了,所以我需要 TTS 来为我的Ubuntu 视频. 您可以获得商业高品质的 Linux 文本转语音软件这里。它真的很贵。我最终花了 40 美元购买了适用于 Windows 的 Natural Reader(在 Wine 下的 Ubuntu 中无法使用)。也许以后我会买 Linux 版的。

相关内容