如何下载 PDF 中的所有链接?

如何下载 PDF 中的所有链接?

我有许多 PDF 文件,需要下载其中的所有超链接。我尝试在 Firefox 中打开 PDF 文件并使用“全部下载”,但我发现它经常无法下载所有文件。那么我该如何实现呢?

答案1

有趣的问题!只要可用,我就会偏爱命令行实用程序,因此在这种情况下,我使用以下命令:

两者都是可移植的(PDFtk 仅作为安装程序提供,但您可以将 pdftk.exe 和 libiconv2.dll 复制到其他地方并根据需要卸载)。当然,您可以用 cURL 或任何您喜欢的程序替换 Wget。

从 Windows 命令行执行以下操作将下载 PDF 中链接的所有文档/页面:

for /f "tokens=2" %l in ('pdftk Test.pdf dump_data_annots ^| find "AnnotActionURI"') do wget "%l"

对多个 PDF 使用以下命令:

for %f in (*.pdf) do for /f "tokens=2" %l in ('pdftk "%~f" dump_data_annots ^| find "AnnotActionURI"') do wget "%l"

相关内容