我有一本扫描书图片压缩成一个PDF文件,我想要保持书原样,但想从图像中提取文本,以便可以选择/复制它。
Linux下有办法做到这一点吗?
答案1
您需要使用光学字符识别程序(OCR)提取文本。这应该可以让您了解 Linux 下可用的内容https://help.ubuntu.com/community/OCR。
我有一本扫描书图片压缩成一个PDF文件,我想要保持书原样,但想从图像中提取文本,以便可以选择/复制它。
Linux下有办法做到这一点吗?
您需要使用光学字符识别程序(OCR)提取文本。这应该可以让您了解 Linux 下可用的内容https://help.ubuntu.com/community/OCR。