我希望能够保存样本的音频谷歌基于云的文本转速度服务e. 可以这样做吗?
答案1
如果您要做很多这样的工作,您确实应该使用他们提供的 API,但如果您只想下载 Google 语音合成的单个样本,这里有一个快速的分步指南。
- 转到 Google Chrome 中的页面。
- 打开开发者工具(按F12)
- 转到“网络”选项卡。
- 输入您想要获取音频的文本。
- 单击“说出来”按钮。
- 查看“网络”选项卡中填充的几个条目。
- 右键单击以 开头的条目
data:audio/wav;base64,
,然后单击“在新选项卡中打开”。 - 在新选项卡中,右键单击音频播放器,然后单击“将视频另存为...”
- 选择要保存结果
.wav
文件的位置。
注意:与从声卡录制立体声混音相比,这将获得(稍微)更清晰的音频副本。
答案2
正如预测的那样此评论,接受的答案现在已损坏。基本方法仍然有效,只是您必须保存proxy.json
然后解码 base64 编码的音频:
cat proxy.json | jq '.audioContent' -r | base64 -d > your-audio.wav
答案3
答案4
以下是当前步骤
- 去https://cloud.google.com/text-to-speech
- 打开开发者工具(按 F12)
- 转到“网络”选项卡。
- 输入您想要获取音频的文本。
- 单击“说出来”按钮。
- 点击“我不是机器人”复选框
- 查看“网络”选项卡中填充的几个条目。
- 右键单击以 proxy?url=https://texttospeech 开头的条目
- 在右侧预览中,点击“audiocontent”行中的“复制”
- 将其保存为文本文件 (base64.txt)。删除开头和结尾的引号 (") 这包含 base64 编码的音频
- 在 Ubuntu 中,使用以下命令将 base64 解码为 wav 文件:
- cat base64.txt | base64 --decode > audio.mp3