我有许多科学论文的 PDF 文件,希望能够在 Kindle 上阅读。它们在我的笔记本电脑上看起来不错,但在 Kindle 上看起来就像低质量的扫描件,阅读起来很糟糕。据我所知,问题在于 PDF 使用位图字体:文本是可选和可搜索的,从远处看起来完全正常,但当我放大时,它非常像素化(并且相同的字母具有完全相同的像素)。
我用的是 Mac,不值得为此购买任何软件。我能做些什么来更改字体?如果需要,我可以编写一些代码或使用终端。
答案1
现在已经很晚了,但由于我今天在谷歌上搜索了同样的东西,所以我觉得添加一些链接可能会有用。确实有一些程序试图用轮廓/矢量字体替换 PS 或 PDF 文件(通常使用旧版本的 Latex 生成)中的位图字体。
http://www.cs.nott.ac.uk/~psadb1/Publications/Download/2003/Probets03.pdf FixFont 和 FontRep 软件
http://www.tex.ac.uk/FAQ-pkfix.html pkfix 和 PStil
如果我能使其中任何一个发挥作用,我会添加我学到的知识......
答案2
如果您使用的是 Adobe Acrobat(版本 9 或更新版本),则可以尝试使用另一种名为 Clearscan 的 OCR。Acrobat 等应用程序中使用的默认 OCR 效果不佳,Clearscan 试图改进这一点并减少文件大小。
以下是 Acrobat 9 的指南,引用来自 Acrolaw 博客。
ClearScan OCR 不是 Acrobat 9 中的默认设置,因此您需要更改设置才能使用它。操作方法如下。
选择:文档 < OCR 文本识别 > 使用 OCR 识别文本... 单击 OCR 窗口中的编辑...按钮:
将 PDF 输出样式更改为 ClearScan。
单击“确定”两次即可对文档进行 OCR。
注意:此设置对于未来的会话是“粘性的”。
我手边没有带有 OCR 文本的 PDF,但对于最新版本的 Acrobat Pro DC,该选项称为“识别文本”(您可以使用文档右侧的工具窗格来搜索它 - 它是增强扫描工具的一部分)。
如果你想了解更多关于 Clearscan 的信息,引用的博客文章详细解释这一点。