如何使用shell脚本读取pdf中的url链接?

如何使用shell脚本读取pdf中的url链接?

我有一个 pdf 格式的 Chrome 书签导出文件,其中包含指向新闻文章、互联网博客的超链接。我想编写一个 shell 脚本来解析该文件,并将每个超链接(即文章、博客等)的内容保存到本地计算机中各自的新 pdf 文件中。任何想法和怪癖都将受到高度赞赏!

答案1

您可以使用pdfgrep,将这些行解析为新文件,并将新文件转换为 pdf。

https://gitlab.com/pdfgrep/pdfgrep

相关内容