我们可以删除每个页面底部的一个又长又窄的可点击栏(带有一些隐藏的文本和链接)这个pdf文件?当我从不单击它时,它会尝试在我的浏览器中打开一个网站。
我更喜欢从命令行执行此操作,因为可能有一个 pdf 文件包含更多包含此类栏的页面。
我试过https://superuser.com/a/536644/9265,但只能删除栏中的文本,栏和超链接仍然存在。
谢谢。
答案1
我不是pdf
格式专家,但从您的示例文件中我相信不需要的部分是对象17
和。要删除这些对象,我将按以下方式使用:33
49
pcregrep
pcregrep -aMv '(17|33|49) 0 obj(.|\n)*?Hello(.|\n)*?endobj' new2.pdf > new3.pdf
这里-a
需要选项将二进制文件视为文本、-M
匹配多行和-v
反转匹配。
之后,您仍然需要按照问题中链接的答案中的描述修复新文件(https://superuser.com/a/536644/9265)。