我正在尝试构建语音转文本和文本转语音转录应用程序。我尝试了 Google 和 IBM 的模块,您能推荐其他可离线使用的模块吗?
答案1
以下是 python 支持的语音识别模块或库,我还提到了可离线使用的库。请浏览此文档了解更多信息
- CMU Sphinx(离线工作)
- Google 语音识别
- Google 云语音 API
- 智慧人工智能
- 微软 Azure 演讲
- Microsoft Bing 语音识别(已弃用)
- Houndify API
- IBM 语音转文本
- Snowboy 热门词汇检测(离线工作)
- Tensorflow
- Vosk API(离线工作)
- OpenAI whisper(离线工作)
答案2
无耻的插件:)
Picovoice 还在设备上处理语音数据,免费套餐每月提供 6000 分钟(100 小时)。 https://picovoice.ai/
下面是一个包含 3 行 Python 代码的 STT 教程: https://picovoice.ai/blog/transcribe-speech-to-text-with-three-lines-of-python/
-为 picovoice 工作