如何在 Debian 中安装最新版本的 tesseract-ocr

如何在 Debian 中安装最新版本的 tesseract-ocr

我遇到了以下问题:

pytesseract.pytesseract.TSVNotSupported: TSV output not supported. Tesseract >= 
3.05 required at image_to_data (/usr/local/lib/python3.5/dist 
packages/pytesseract/pytesseract.py:371)

我的 tesseract -v 是 3.04.01。

sudo apt-get install tesseract-ocr

tesseract-ocr is already the newest version (3.04.01-5)

当我运行时sudo apt install tesseract-ocr=3.05.01,出现未找到版本错误。

如何安装 tesseract-ocr 的更高版本?

我的操作系统信息:

PRETTY_NAME="Debian GNU/Linux 9 (stretch)"
NAME="Debian GNU/Linux"
VERSION_ID="9"
VERSION="9 (stretch)"
ID=debian
HOME_URL="https://www.debian.org/"
SUPPORT_URL="https://www.debian.org/support"
BUG_REPORT_URL="https://bugs.debian.org/"

我的 /apt/sources.list 中有以下内容:

deb http://deb.debian.org/debian/ stretch main
deb-src http://deb.debian.org/debian/ stretch main
deb http://security.debian.org/ stretch/updates main
deb-src http://security.debian.org/ stretch/updates main
deb http://deb.debian.org/debian/ stretch-updates main
deb-src http://deb.debian.org/debian/ stretch-updates main

答案1

首先检查最新发布的版本是什么在官方文档中或者在 Github 仓库中

然后检查如何安装最新版本取决于您的系统。

在 Debian Stretch 上,目前最新版本 4.1.1 可以从以下位置安装(风险自负):notesalexp.org

echo "deb [trusted=yes] https://notesalexp.org/tesseract-ocr/stretch/ stretch main" >> /etc/apt/sources.list
# Run if you want other language packages, e.g. `tessdata_best`
echo "deb [trusted=yes] https://notesalexp.org/tesseract-ocr/tessdata_best/ stretch main" >> /etc/apt/sources.list
apt-get update && apt-get install tesseract-ocr=4.1.1+git4247-97079fa3-1

相关内容