我如何读取 PDF 的源代码

我如何读取 PDF 的源代码

我想获取 PDF 文件的源代码。不幸的是,当我用文本编辑器打开 PDF 时,有些行没有意义……就像……

%PDF-1.6
%âãÏÓ
3 0 obj
<</Ff 0/F 6/Type/Annot/Subtype/Widget/DR<</Font<</Helv 2 0 R>>>>/T(Ä\n¬4^XÈ4ýæçO§W²W^D³^Ywzº<92>õÌ^AÀÄi]â<96><8c>)/V(Ä\n¬4^XÈ4ýæçO§W²W^Dø<93>r^D¥à<82>ú<83>Z^Q7^Cv^FÈ)/AP<</N 1 0 R>>/P 4 0 R/BS<</W 1/S/S>>/FT/Tx/Rect[40 50 70 80]/DA(Ä\n¬4^XÈ4ýæçO§W²W^Dù~êw3<84>&^X´âL|q@³^VC<8a>"Ýo^N¿=Ì<91>ta^R`àz)>>
endobj
6 0 obj

因此 %PDF-1.6 没问题,但是在它无法解析正确的字母之后......我尝试用 vim ...有没有机会获得正确的内容....

答案1

您无法使用常规文本编辑器打开 PDF 文件,您必须使用十六进制编辑器,例如 ghex。通过在控制台上运行来安装它:

sudo apt-get install ghex

或者在 Ubuntu 软件中心搜索 ghex。在此处输入图片描述

答案2

尝试 qpdf:

qpdf --qdf --object-streams=disable orig.pdf expanded.pdf

您应该能够在文本编辑器中打开“expanded.pdf”。

(当然,您可能必须安装 qpdf。)

相关内容