我有一个包含近 4000 个 pdf 文件的文件夹,这些文件被我的同事意外地扫描成了 pdf 文件而不是 jpg 文件。我们扫描了近 7000 个纸质文件,但第二班的某个时候,不知怎么的,这些文件就被保存成了 pdf。
这最初是在 Windows 上完成的,我已经寻找解决方法一个多星期了,每个人都说使用 Linux,在此过程中我安装了 mint,然后将其转储为 Ubuntu。我对命令行一无所知。
我所需要的只是一个简单的命令来转换整个文件夹的内容。问题是,在所有扫描的文件中,我们无法从原始文件中知道哪些文件是正确的,哪些文件是作为 pdf 格式的,或者我们只能重新扫描它们——所有的 pdf 文件都单独放在一个文件夹中。
我不知道该输入什么、在哪里输入或如何让它工作。请帮忙!
答案1
这将有助于将所有pdf
文件转换为jpg
图像。它将保留原始文件名并为其添加页码,因为这必须逐页完成。
指示:
打开终端并进入包含您需要转换的文件的目录,例如,如果该目录已命名
pdf_files
并位于您的目录中,home
则运行以下命令:cd ~/pdf_files
或者
cd /home/your_username/pdf_files
进入该目录后(当您看到目录名称出现在左侧闪烁的光标之前时就会知道),您可以在终端中键入或复制并粘贴以下命令,然后按回车键:
find . -maxdepth 1 -type f -name '*.pdf' -exec pdftoppm -jpeg {} {} \;
jpg
完成后,您将在同一目录中与旧文件一起找到新转换的文件pdf
。
额外步骤:
如果您希望将转换后的jpg
文件与原始pdf
文件分离,请在完成步骤后在终端中运行以下命令# 2jpg_files
上面在当前目录中创建一个名为的新目录并将所有jpg
文件移动到其中:
mkdir jpg_files && mv *.jpg jpg_files/