对多个文件执行 OCR 和重命名

Question

您可以尝试以下操作：

mkdir renamed

for filename in *.jpg
do
text=$(tesseract "$filename" stdout | head -1)
cp "$filename" renamed/"$text".jpg
done

for filename in *.jpg对匹配的文件进行循环*.jpg；
text=$(tesseract "$filename" stdout | head -1)tesseract在文件上执行并将文本导入到head -1，它只输出第一行。结果进入变量text
cp "$filename" renamed/"$text".jpg将文件复制到renamed名为的目录"$text".jpg。

要消除所需文本之前读取的任何垃圾，可以使用text=$(tesseract "$filename" stdout | grep -E ".{10}" | head -1)。该命令grep -E ".{10}"将消除任何少于 10 个字符的行。

如果您要使用移动或重命名命令，请先备份文件。

Answer 1

您可以尝试以下操作：

mkdir renamed

for filename in *.jpg
do
text=$(tesseract "$filename" stdout | head -1)
cp "$filename" renamed/"$text".jpg
done

for filename in *.jpg对匹配的文件进行循环*.jpg；
text=$(tesseract "$filename" stdout | head -1)tesseract在文件上执行并将文本导入到head -1，它只输出第一行。结果进入变量text
cp "$filename" renamed/"$text".jpg将文件复制到renamed名为的目录"$text".jpg。

要消除所需文本之前读取的任何垃圾，可以使用text=$(tesseract "$filename" stdout | grep -E ".{10}" | head -1)。该命令grep -E ".{10}"将消除任何少于 10 个字符的行。

如果您要使用移动或重命名命令，请先备份文件。

相关内容