我有一个包含 100 张 jpg 图像的文件夹。我想将这些图像转换为多页 pdf 文件,其中包含所有图像(裁剪为 A4 尺寸)。它们已经处于正确的轮换状态。
我应该使用哪些工具?
答案1
要求
图像魔术师
在命令提示符下键入以下行以安装 ImageMagick:
sudo apt-get install imagemagick
从 jpeg 转换为 PDF:
进入工作目录(jpegs目录):
cd work/directory/path
将 JPG 文件转换为 PDF:
convert *.jpg foo.pdf
答案2
很遗憾convert
更改之前的图像,以便将质量损失降到最低,即原始质量jpg
,您需要使用img2pdf
,我使用以下命令:
一种较短的单内衬解决方案,仅使用img2pdf
制作PDF
img2pdf *.jp* --output combined.pdf
可选择将 OCR 添加到输出 PDF
ocrmypdf combined.pdf combined_ocr.pdf
这是原始命令,需要更多命令和更多工具:
这是为了将
pdf
每个jpg
图像创建一个文件,而不会损失分辨率或质量:ls -1 ./*jpg | xargs -L1 -I {} img2pdf {} -o {}.pdf
这将页面连接
pdf
成一个:pdftk *.pdf cat output combined.pdf
最后,我添加了一个 OCRed 文本图层,该图层不会改变 pdf 中的扫描质量,因此可以搜索它们:
pypdfocr combined.pdf
答案3
我强烈推荐使用 Python CLI 程序img2pdf
进行无损转换:
https://gitlab.mister-muffin.de/josch/img2pdf
用法示例:
img2pdf img1.png img2.jpg -o out.pdf