如何提取 PDF 文件中页面外的内容?

如何提取 PDF 文件中页面外的内容?

一家科学出版商已将其期刊的 PDF 版本呈现为文章正文不在页面的可见部分。左侧边距很大,正文将溢出到页面的右侧,最终位于页面的不可见部分。

溢出的部分可以被选中并复制为文本 - 因此它是文档的一部分 - 但我尝试过的所有 PDF 查看器(Apple Preview、Google Chrome、Adobe Reader)都不会显示页面边界之外的内容。

有没有办法在更大的画布上呈现所有可见和不可见的内容(例如,如果原始 PDF 是 A4,则目标将是 A3)或以其他方式按预期查看 PDF 文件?将文本主体复制并粘贴到文本编辑器是不可接受的,因为数字和非拉丁文字不会正确显示在复制目标中。

以下屏幕截图可以说明哪里出了问题:

在此处输入图片描述

相关内容