是否有一些适用于 Linux 或 Windows 的 PDF 编辑器/查看器可以显示所选元素的位置和文档大小(以英寸为单位)?
答案1
我找到了一个用 Ruby 编写的控制台工具,叫做pdf 摘录,它可以显示文本区域和文档大小(以像素为单位)。我不确定它是否适用于 Windows,但在 Linux 中它运行得很好(除了需要安装其依赖项 pdf-reader 版本 1.1.1,更高版本不起作用)。
使用示例:
pdf-extract extract --regions file.pdf
示例输出:
<?xml version="1.0"?>
<pdf>
<page width="612" height="792" number="1">
<region x="40.73" y="682.68" width="62.53" height="4.47" line_height="4.47" font="CHRUEN+MetaPlusMedium-Roman">
<line x_offset="0.0" y_offset="0.0" spacing="0.0">xxxx</line>
</region>
<region x="41.65" y="669.18" width="60.69" height="4.47" line_height="4.47" font="CHRUEN+MetaPlusMedium-Roman">
<line x_offset="0.0" y_offset="0.0" spacing="0.0">xxxx</line>
</region>
<region x="40.81" y="655.68" width="62.38" height="4.47" line_height="4.47" font="CHRUEN+MetaPlusMedium-Roman">
<line x_offset="0.0" y_offset="0.0" spacing="0.0">xxxx</line>
</region>
<region x="19.48" y="640.69" width="5.86" height="5.9" line_height="5.9" font="XBCKNX+AGaramond-Italic">
<line x_offset="0.0" y_offset="0.0" spacing="0.0">xxx</line>
</region>
<region x="27.44" y="640.69" width="97.07" height="5.96" line_height="4.47" font="CHRUEN+MetaPlusMedium-Roman">
<line x_offset="0.0" y_offset="1.49" spacing="0.0">xxx</line>
<line x_offset="44.96" y_offset="0.0" spacing="-4.42">xxx</line>
</region>
<region x="43.18" y="628.68" width="57.64" height="4.47" line_height="4.47" font="CHRUEN+MetaPlusMedium-Roman">
<line x_offset="0.0" y_offset="0.0" spacing="0.0">xxxx</line>
</region>
</page>
</pdf>
其中“xxx”是实际文本