有时我会遇到一个 PDF,它一开始看起来没问题,但底层文本是乱码。目前我有一个 PDF,其中只有标题是乱码,我想知道是否有可能以某种方式用正确的文本替换乱码文本。
我考虑过对特定页面进行 OCR 处理,但这只有将页面转换为图像时才有效。
我如何手动更正底层文本或仅对特定部分进行重新 OCR?
答案1
在 Acrobat Pro 中:视图 --> 工具 --> 识别文本
将调出 OCR 工具栏。从那里,使用“OCR 疑似错误”工具来纠正 PDF 中的错误。
有时我会遇到一个 PDF,它一开始看起来没问题,但底层文本是乱码。目前我有一个 PDF,其中只有标题是乱码,我想知道是否有可能以某种方式用正确的文本替换乱码文本。
我考虑过对特定页面进行 OCR 处理,但这只有将页面转换为图像时才有效。
我如何手动更正底层文本或仅对特定部分进行重新 OCR?
在 Acrobat Pro 中:视图 --> 工具 --> 识别文本
将调出 OCR 工具栏。从那里,使用“OCR 疑似错误”工具来纠正 PDF 中的错误。