尝试做这样的事情:
第一步:
convert img.jpg img.pdf
第二步:
pdfimages -j img.pdf img1
比较十六进制中的源图像和提取的图像显示出差异。如何进行这样的转换而不丢失数据?
答案1
一种方法是使用pdflatex
而不是convert
.
您需要一个额外的文件,此处称为image.tex
:
\documentclass{article}
\usepackage[active,tightpage]{preview}
\usepackage{graphicx}
\PreviewMacro[{*[][]{}}]{\includegraphics}
\begin{document}
\includegraphics{img.jpg}
\end{document}
然后运行pdflatex image.tex
生成image.pdf。
答案2
您确定有完整的 JPEG - 元数据吗和PDF 中 JFIF/JPEG 格式的图片数据?如果不是,那么即使图像数据被逐字提取,pdfimages
也将不得不重建容器并且这可能不匹配。
对于音频文件和标签等,您可能会遇到类似的情况 - 如果更改元数据,则无法进行总和比较。
在这种情况下,您需要仅计算数据部分的哈希值,而不是整个文件。