Okular 中的一些 pdf 页面是空白的

Okular 中的一些 pdf 页面是空白的

短篇故事:一些程序(包括 Okular)会将特定(1000 多页)pdf 中的部分页面显示为空白,但其他程序(包括一些互联网浏览器)会显示所有页面而没有空白。

将所有页面提取为 pdf 后,同样的问题页面也会出现。我已将其中一个页面上传到文档机器人进行测试。(请下载此页面并查看您的 Okular 是否能像在 Firefox 或 Vivaldi 中一样看到其内容。)

即使是 Android 查看器也能很好地处理这些页面/文件。


更长的故事:

我有一本将近 1500 页的旧扫描字典的 PDF。Okular 显示许多页面是空白的。请参阅此处的概述:

在此处输入图片描述

PDF 排列器中也是一样:

在此处输入图片描述

这对我来说并不是什么大惊喜,但我认为我可以通过使用 PDF Arranger 删除空白页来清理这本字典,或者更简单地通过将页面提取为 pdf 或 png,删除空白页(比使用前面提到的工具更容易识别、选择和删除 - 因为它们的尺寸很小),然后用剩余的页面重新创建 pdf。

提取的 png 文件与预期一致,我可以轻松识别空白文件:它们的大小不到 2 KiB。Dolphin 缩略图也显示了空白 png,接近上面看到的图像。

但因为我还提取了这些页面作为 pdf,我很惊讶地发现 Dolphin 单独 pdf 页面的缩略图视图现在没有任何空白!此外,1 页 pdf 之间的大小没有明显差异。

在 Okular 中打开这些 1 页的疑似 pdf 文件时,它们仍然显示为空白,在 Qpdfviewer 和 PDF Aranger 中也出现了同样的情况,但在 WPS Pdf、Master PDF、LibreOffice-Draw 和 Firefox 中没有出现这种情况:在那里,可以看到内容,页面不是空白的。

也许是一个重要的细节:

提取的空白 png 文件(也很小)完全是空白的,而有问题的 PDF 页面(如果提取为 PDF,大小不会减少)在显示为空白时则不是充分因此:仍然可以看到底部的 FOOTER 行,其余部分为空白。

在此处输入图片描述

使用相同的命令将页面提取为pdf和png pdftoppm:。

现在我已经确定了有问题的页面并且可以轻松测试。

在 Vivaldi 和 Opera 等 Chromium 系列浏览器之一中将这些文件打印为 PDF,生成的 PDF还是一片空白(对于 Okular 和其他已经受到影响的用户)除非在其设置中选择了“打印为图像”选项。 - 如果选择了该选项或者在 Firefox 中打印为 pdf,则会输出一个在 Okular 中正常显示的 pdf 文件!

用其他程序进行测试并总结:

  • 所有页面均可通过 WPS PDF、Master PDF、Firefox、Vivaldi 浏览器、LibreOffice Draw、ImageMagick、mupdf、PDF Studio Viewer 查看

  • 空白(带有该页脚)显示在 Okular、Qpdfviewer、PDF Aranger、Falkon (!)、Inskape、Krita 中

  • 在 Kubuntu 中以 snap 形式安装的 Evince(文档查看器)无法打开大文件,也无法打开任何单独的 pdf 页面,而是给出错误:(Error opening file the.pdf: Permission denied它会打开其他 pdf 文件)


  • 可能是什么问题?

  • 我可以在系统级别修复这个问题吗?

    Okular 和 Qpdfviewer 似乎是唯一受到此影响的 PDF 查看器(无论文件本身可能存在什么问题)。

我更喜欢使用 Okular 来处理我的所有 pdf。

答案1

  • 这是 的一个错误poppler,已发布这里, 最初这里、Evince 和 Atril(Mint PDF 查看器)也受到影响。

  • 为了修复这些页面,我在 Firefox(或 Chrome、Vivaldi、Opera - 也必须选择“打印为图像”)中将它们“打印为 PDF”。根据 RAM 容量,一次“打印为 PDF”的页面不应超过 200-300 页,以避免死机/崩溃。

相关内容