我有一个 jpg 文件目录,这些文件是我的手写笔记的扫描件。如何将它们转换为以文件名作为书签的单个 pdf 文件?
(我最终也想添加 ocr。正如网上提到的,我们可以将文件转换.jpg
为.pdf
using img2pdf .jp --output combined.pdf
,然后我们可以使用 添加 ocr ocrmypdf combined.pdf combined_ocr.pdf
。我的问题主要是如何确保 pdf 文件具有书签(从文件名创建)以便于浏览该文档。)
答案1
ImageMagick Convert 可以将 jpg 图像转换为 pdf 文件。
convert *.jpg document.pdf
ImageMagick 可能会拒绝执行此操作,并显示如下消息
convert-im6.q16: attempt to perform an operation not allowed by the security policy `PDF' @ error/constitute.c/IsCoderAuthorized/408.
在这种情况下,请使用此处的建议:https://stackoverflow.com/questions/52998331/imagemagick-security-policy-pdf-blocking-conversion
ImageMagick 将制作没有书签的 pdf。您必须在此答案的帮助下添加它们https://stackoverflow.com/questions/30304718/create-bookmarks-into-a-pdf-file-via-command-line。
如果您编写一个脚本对 jpg 文件进行排序(每页一个),您就会知道每页上是哪个 jpg。首先,您必须指定每个 jpeg 文件
convert a.jpg b.jpg ... z.jpg output.pdf
然后,您将书签 a.jpg 设置到第一页,将 b.jpg 设置到第二页,依此类推。这样,您也应该能够添加书签。
我想您需要编写一些脚本/编程,但我确信这是可以完成的。