当我收到警告时,如何在不安装 tesseract 3.03 的情况下解决问题:
警告:您正在运行不受支持的 Tesseract 版本。预期版本 3.03,您的版本是:3.02.02 打开数据文件 /usr/local/share/tessdata/lus.traineddata 时出错请确保将 TESSDATA_PREFIX 环境变量设置为“tessdata”目录的父目录。加载语言“lus”失败 Tesseract 无法加载任何语言!分段错误(核心转储)
答案1
检查包是否已安装
dpkg -l | grep tesseract
安装 teseract使用包
sudo apt install tesseract-ocr
搜索/安装可用的相关包
apt search tesseract | grep -B1 language
使用有效的ISO 639-2(三个字母)语言代码。
tesseract image.png -l spa myoutput
会产生myoutput.txt
有关的
- 提高 OCR 之前的图像质量
- 将文本添加到 PDF和
pdfsandwich -verbose -lang spa -layout single scanned.pdf
答案2
这是解决方案:
只需将文件从:openalpr/runtime_data/ocr/tessdata 复制到 /usr/local/share/tessdata