将图像转换为文本

Question 1

有许多光学字符识别 (OCR)适用于 Linux 的阅读器，可以将图像转换为文本。查看以下选项：

除 ocropus 之外的所有内容都存在于 Ubuntu 存储库中同名的包中。

不同的阅读器支持不同的图像格式，因此您的选项可能会受到文档文件格式的限制。或者，您可以使用转变如果您希望使用特定的 OCR 阅读器，可以使用 ImageMagick 的工具来更改格式。

改编自我的回答这里。

Answer

有许多光学字符识别 (OCR)适用于 Linux 的阅读器，可以将图像转换为文本。查看以下选项：

除 ocropus 之外的所有内容都存在于 Ubuntu 存储库中同名的包中。

不同的阅读器支持不同的图像格式，因此您的选项可能会受到文档文件格式的限制。或者，您可以使用转变如果您希望使用特定的 OCR 阅读器，可以使用 ImageMagick 的工具来更改格式。

改编自我的回答这里。

Question 2

您需要首先在 Linux 机器上安装“tesseract-ocr”。

sudo apt-get install tesseract-ocr

您可以从命令行手动执行此操作：

tesseract -l eng input.jpg output

或者，我已经编写了 PHP 代码来执行相同的操作，如果您愿意，可以使用它。

注意：要运行此代码，执行应该在 php.ini 中启用命令。

<?php
//IMAGE TO TXT Conversion
    $input_file = $_REQUEST['input_file'];
    $out = explode(".",$input_file);
    
    $output_file = $out[0]."_".$out[1];
    $output_file_name  =    $output_file.".txt";
    
    echo "<br />----IMAGE To TXT conversion Started-----</br />";
    echo  exec('tesseract '.$input_file.' '.$output_file);
    echo "<br />----TXT conversion Done-----</br />";
    
    echo "<br /><b>Please Check----->".$output_file.".txt</b><br />";
    echo "Click <a target='_blank' href='".$output_file_name."'>Here </a>to view it<br />"; 
?>

将此代码放在根文件夹中并从浏览器访问它，例如：

http://yourserver.com?input_file=1.png

注意：该文件1.png应存在于您当前的目录中。

Answer