如何从 Google 的示例文本转语音中下载音频?

如何从 Google 的示例文本转语音中下载音频?

我希望能够保存样本的音频谷歌基于云的文本转速度服务e. 可以这样做吗?

答案1

如果您要做很​​多这样的工作,您确实应该使用他们提供的 API,但如果您只想下载 Google 语音合成的单个样本,这里有一个快速的分步指南。

  1. 转到 Google Chrome 中的页面。
  2. 打开开发者工具(按F12
  3. 转到“网络”选项卡。
  4. 输入您想要获取音频的文本。
  5. 单击“说出来”按钮。
  6. 查看“网络”选项卡中填充的几个条目。
  7. 右键单击以 开头的条目data:audio/wav;base64,,然后单击“在新选项卡中打开”。
  8. 在新选项卡中,右键单击音频播放器,然后单击“将视频另存为...”
  9. 选择要保存结果.wav文件的位置。

注意:与从声卡录制立体声混音相比,这将获得(稍微)更清晰的音频副本。

答案2

正如预测的那样此评论,接受的答案现在已损坏。基本方法仍然有效,只是您必须保存proxy.json然后解码 base64 编码的音频:

cat proxy.json | jq '.audioContent' -r | base64 -d > your-audio.wav

答案3

编辑:@3D1T0R 的回答更简单,并且很可能产生更高质量的文件。


我只需要使用录音程序,例如大胆,录制计算机的“立体声混音”。您尚未指定操作系统,但假设 Windows:

  • 首先进入控制面板中的声音小程序,转到Recording选项卡,右键单击Stereo Mix并选择Enable。 (如果没有看到Stereo Mix,请检查Show disabled devices在此处输入图片描述

  • 然后下载/打开 Audacity,在“录音设备”下拉框中选择Stereo Mix。然后点击“录音”,你听到的从扬声器播放的任何内容都将被录制到声音文件中。

在此处输入图片描述

答案4

以下是当前步骤

  1. https://cloud.google.com/text-to-speech
  2. 打开开发者工具(按 F12)
  3. 转到“网络”选项卡。
  4. 输入您想要获取音频的文本。
  5. 单击“说出来”按钮。
  6. 点击“我不是机器人”复选框
  7. 查看“网络”选项卡中填充的几个条目。
  8. 右键单击以 proxy?url=https://texttospeech 开头的条目
  9. 在右侧预览中,点击“audiocontent”行中的“复制”
  10. 将其保存为文本文件 (base64.txt)。删除开头和结尾的引号 (") 这包含 base64 编码的音频
  11. 在 Ubuntu 中,使用以下命令将 base64 解码为 wav 文件:
  12. cat base64.txt | base64 --decode > audio.mp3

截屏

相关内容