我正在做一个帮助视障人士聆听印刷纸上文字的项目。我已经处理了将印刷文本图片转换为带有数字文字的 pdf 文件的部分。现在我想让 espeak 访问该文字并使用 python 大声朗读。有人可以指导吗?
答案1
可以通过命令行将以下输出通过管道传输到语音,从而实现非常简单的图像到语音的转换:tesseract-ocr 以 espeak 的形式。这无需进一步编码或转换,直接从图像源即可完成:
tesseract image.png stdout | espeak
我正在做一个帮助视障人士聆听印刷纸上文字的项目。我已经处理了将印刷文本图片转换为带有数字文字的 pdf 文件的部分。现在我想让 espeak 访问该文字并使用 python 大声朗读。有人可以指导吗?
可以通过命令行将以下输出通过管道传输到语音,从而实现非常简单的图像到语音的转换:tesseract-ocr 以 espeak 的形式。这无需进一步编码或转换,直接从图像源即可完成:
tesseract image.png stdout | espeak