我想让 tesseract 转换文件夹中的所有文件。我不想以任何方式合并文件,因为我在使用 hocr2pdf 和 pdfbeads 等程序一次合并多个文件时遇到了麻烦。
我运行tesseract *.tif * hocr
后得到以下结果
read_params_file: parameter not found: II*
答案1
我试过了,它有效
for i in *.tif ; do tesseract $i outtext; done;
确保当你在终端时将目录更改为所有文件的位置
答案2
我稍微修改了 Meer Borg 的答案。使用该代码,我的输出文件仅包含文件夹中最后一个文件的输入。
使用 tesseract 的stdout
选项>>
可以将所有输出附加到单个文件:
for i in *.tif ; do tesseract $i stdout >> outtext; done;