Ubuntu 中的语音识别:从音频转换为文本

Ubuntu 中的语音识别:从音频转换为文本

我正在使用以下命令:

ffmpeg -i file.mp3 -ar 16000 -ac 1 file.wav
pocketsphinx_continuous -infile file.wav 2> pocketsphinx.log > result.txt

一切正常,但我想知道是否有一个命令脚本可以循环转换所有音频文件,以及是否有可能在 pocketsphinx 中支持其他语言,如阿拉伯语和法语,以及如何做到这一点。

相关内容