我手头有一个很长的 PDF 文件。这个文件的每一页上都有一个烦人的水印/徽标,我想删除它。印刷店在扫描文档时非法在别人的作品上添加了自己的徽标。
这里这是文档中任意一页的截图。我用红色圈出了我想删除的水印。谢谢。
编辑:这个问题不是重复的。其他答案对我来说根本不起作用。水印在我的例子中是页面扫描的一部分,它不是 pdf 文件中的元数据。请在关闭问题之前阅读它们。
答案1
- 首先解压缩 pdf 文件
pdftk input.pdf output uncompressed.pdf uncompress
- 识别水印线
在文本编辑器中打开未压缩的pdf文件,例如vim,gedit,notepad ++等。
搜索“水印”并识别水印线,即
EMC /Artifact <</Subtype/Watermark/Type/Pagination>> BDC /FXE2 gs q 0.476256 0 0 0
FXX4 Do Q
- 删除所有重复的水印行,在本例中,我们使用“0.476256 0 0”作为行指示符,然后删除
sed -i '/0.476256 0 0/d' ./uncompressed.pdf
- 将 pdf 文件压缩回去
pdftk uncompressed.pdf output output.pdf compress