我是一名学生,我有一个 4 页的 PDF 样本测试文档。测试问题的答案用蓝色笔写在文档上;文档中仅有的其他颜色是黑色(文本问题)和白色(PDF 背景)。
有没有一种免费、简单的方法可以删除文档中的所有蓝色实例?我认为 Photoshop 中的某些方法可能有用,但不幸的是,我现在无法使用任何图像编辑软件。
答案1
我能够使用 Imagemagick 命令行工具做这样的事情,基于另一个答案。
此示例转换 input.pdf 的前四页,将两种颜色 RBG 十六进制c00000
和4472c4
白色更改为 1%“模糊系数”。我使用 gimp 屏幕截图导入来检查十六进制颜色。
convert -density 300 +antialias 'input.pdf[0-3]' \
-fuzz 1% -fill white -opaque '#c00000' \
-fuzz 1% -fill white -opaque '#4472c4' \
output.pdf
您可能需要启用 PDF 转换第一的。
此解决方案的问题在于,它会将输出 PDF 中的每一页都转换为图像。我只需要这样做,就可以打印文档,所以这对我来说不是问题。
该+antialias
选项关闭抗锯齿功能。如果不关闭该功能,被删除的文本的模糊边框仍然可见。
答案2
- 将 PDF 转换为 HTML。https://cloudconvert.com/pdf-to-html
- 在 Web 浏览器中打开 HTML 文件。
- 打开检查元素。
- 单击“选择页面中的元素进行检查”图标。
- 单击一些红色文本并找到负责的 CSS 类
color: red;
- 添加
display: none;
到同一类即可隐藏它。 - 打印该页面并将其保存为 PDF。
- 瞧!✨
您的矢量文本仍保留在新的 PDF 中,除非您勾选“打印为图像”。