为何旧报纸的字体看上去很凌乱?

为何旧报纸的字体看上去很凌乱?

旧论文(<2000 年)的字体在我的 Linux 机器上看起来有些混乱。这是为什么?

凌乱的字体

以下是论文:http://acl.ldc.upenn.edu/H/H94/H94-1048.pdf

答案1

这几乎肯定是由于扫描过程(无论是否使用 OCR)。期刊开始使用电子出版相对较晚。大多数较旧的论文都是从原始的印刷纸质版本扫描成 PDF 的。这就是为什么字体看起来很奇怪。

您所看到的是字体的图像,然后(可能)通过 OCR 软件将其转换为文本。较新的论文看起来更好,因为它们是直接创建为 PDF 的。

相关内容