音频播放未从头开始

音频播放未从头开始

当我使用 mpg321 或 aplay 或 sox 甚至在 TTS(文本朗读)中运行音频文件时,音频仅从我第二次再现音频文件时正确输出......

根据文本转语音中的示例:如果写“Hello World!”它只说“orld”,或者如果我写“你是一个好男孩”,它只说“一个好男孩”......为什么?

我怎样才能解决这个问题?

在 TTS 中,所有 TTS 都会发生这种情况:espeak、Google Api、VoiceRSS Api 等...并且也会发生在我的旧树莓派 (Raspbian) 中,而不仅仅是在我的 Ubuntu (14.04.1 LTS) 中

我猜是因为音频引擎或类似的东西有 0.5 - 2 秒的延迟才能启动。然后跳过音频的前两秒。

如果我运行相同的音频两次或三次,等等,从第二次开始它就运行良好,但前提是我速度很快......

我需要它来进行文字朗读。

Raspberry Pi 和 Ubuntu Machine 均通过 HDMI 连接。

我该如何解决?说出所有的话?还有从头开始的音频?

答案1

通过 HDMI 连接的输出设备需要几秒钟才能同步到它开始从系统接收的数据流。您可以考虑首先添加几秒钟的静音,或者在应用程序期间持续播放静音以保持同步,然后在需要时混合 TTS 输出。

编辑:似乎与这个问题相关,那里的建议也可能有帮助:askubuntu.com

答案2

打开 pavucontrol 将使同步保持打开状态,因此当您想要进行 TTS 时只需启动它即可。

注意:在我的系统上,打开它会阻止我启动 SPDIF 直通(即杜比数字),但关闭它并在启动直通之前等待几秒钟即可使它们工作。

相关内容