我正在寻找一些适用于 Ubuntu 的易于安装的文本转语音软件,这些软件听起来很自然。我安装了Festival
、Gespeaker
等等,但没有一个听起来很自然。一切都很合成,很难理解。
有没有什么建议?
答案1
SVOX pico2wave
sudo apt install libttspico-utils
非常简约的 TTS,听起来比 espeak 或 mbrola 更好(在我看来)。一些信息这里。
我不明白为什么与 espeak 或 mbrola 相比,pico2wave 很少被提及。它很小,但声音非常好(自然)。无需修改,您就会听到自然的女性声音。
而且...与 Mbrola 相比,它可以识别单位并以正确的方式朗读!
例如:
- 2°C → 2 度
- 2米 → 2米
- 2公斤→2公斤
安装后我在脚本中使用它:
#!/bin/bash
pico2wave -w=/tmp/test.wav "$1"
aplay /tmp/test.wav
rm /tmp/test.wav
然后使用所需的文本运行它:
<scriptname>.sh "hello world"
或者读取整个文件的内容:
<scriptname>.sh "$(cat <filename>)"
这就是在 Ubuntu 上拥有一个轻量级、稳定工作的 TTS 的全部内容。
答案2
Pico 和 espeak 很有趣,而且很容易上手,但它们并不是那么好。默认的 Festival 声音也不是那么好。然而,Festival 是一个基于方案的语音框架,许多研究人员已经构建了更好的插件声音。您可以轻松超越原版 Ubuntu 上的 pico2wave 质量,因为其中一种声音是现成的软件包。
为了让 Festival 听起来自然,请执行以下操作:
sudo apt-get install festival
sudo apt-get install festvox-us-slt-hts
festival -i
festival> (voice_cmu_us_slt_arctic_hts)
festival> (SayText "Don't hate me, I'm just doing my job!")
您可以从命令行通过使用-b
(或--batch
) 并将每个命令放在单引号中来执行此操作:
festival -b '(voice_cmu_us_slt_arctic_hts)' \
'(SayText "The temperature is 22 degrees centigrade and there is a slight breeze from the west.")'
您可以从 Nitech 存储库中获得其他相当不错的声音,但安装它们很麻烦,并且默认路径发生了变化,因此捆绑的方案文件中的文件名引用可能需要手动编辑才能在原始 Ubuntu 上运行。
答案3
说出来!
我相信我已经找到了最好的免费 TTS 软件,使用名为“SpeakIt”的 Google Chrome 扩展程序。对于我来说,这只适用于 Ubuntu 上的 Chrome 浏览器。出于某种原因,它不适用于 Chromium。SpeakIt 附带两种女性声音,与其他所有声音相比,这两种声音听起来都非常逼真。如果您使用“TTS”作为查询在 Chrome Web Store 中搜索,Chrome 扩展程序中至少列出了四种男性和女性声音。
用法:用于网站上。突出显示要阅读的文本,然后右键单击并“SpeakIt”或单击停靠在 Chrome 顶部栏上的 SpeakIt 图标。
Firefox 用户还有两个选项。在 Firefox 附加组件中,搜索 TTS你应该会找到“点击说话”和“文本转语音”。这些声音不如 Chrome SpeakIt 的声音好,但绝对可用。
SpeakIt 扩展使用 iSpeech 技术,网站每年收费 20 美元,可以将文本转换为 MP3 音频文件。您可以输入文本、URL、RSS 订阅源以及 TXT、DOC 和 PDF 等文档并输出为 MP3。您可以制作播客、嵌入音频等。以下是链接, 和他们的音频样本(不知道该链接将持续多久)。