我有一个 pdf,里面有一些透明的图形和文字。像这样:(当然它有更多的文字)
然后我使用 \includepdf 命令将其插入到 latex 项目中。
\documentclass[10pt,a4paper]{article}
\usepackage{pdfpages}
\begin{document}
\includepdf[pages={-}]{未转曲文件---删除多余图片1}
\end{document}
然后我通过 ghostscript 工具绘制此 pdf
gs -sDEVICE=pdfwrite -sProcessColorModel=DeviceCMYK -sColorConversionStrategyForImages=CMYK -sColorConversionStrategy=CMYK -o ./dest.pdf -f ./source.pdf
使用 pdf-praser 分析后
/usr/bin/python pdf-parser.py -o 67 document.pdf
, 我发现
\包括pdf
latex中的命令使得pdf结构发生了很大的变化。
如果我没记错的话,origin pdf 有一个 /group,其中包含透明度信息:
但后来它就消失了。
我不知道其中的原因,并且这个问题困扰了我一个星期。
希望得到答复。
https://github.com/David553/latex.git
这是我的测试 pdf 文件。
origin-file.pdf 是原始 pdf 文件;
delete-redundant-thing 是我为了方便测试而删除多余的文字和图片的文件;
after-includepdf.pdf 是我在 latex 中使用 \includepdf{} 命令的文件;
after-gs.pdf 是我使用 ghostscript line 命令绘制曲线的文件;