让 Espeak 在 ubuntu 上读取图片中的文字

让 Espeak 在 ubuntu 上读取图片中的文字

我正在做一个帮助视障人士聆听印刷纸上文字的项目。我已经处理了将印刷文本图片转换为带有数字文字的 pdf 文件的部分。现在我想让 espeak 访问该文字并使用 python 大声朗读。有人可以指导吗?

答案1

可以通过命令行将以下输出通过管道传输到语音,从而实现非常简单的图像到语音的转换:tesseract-ocr 安装 tesseract-ocr以 espeak 的形式。这无需进一步编码或转换,直接从图像源即可完成:

tesseract image.png stdout | espeak

相关内容