将 PDF 的 Adob​​e Acrobat 注释导出为文本文件?

将 PDF 的 Adob​​e Acrobat 注释导出为文本文件?

我有许多 PDF 文件,其中包含数百条注释/评论,这些注释/评论是通过免费的 Adob​​e Acrobat Reader 创建的。通过阅读本官方指南,并浏览相关页面,我发现我可以以 FDF 文件或 XFDF 格式“导出”评论。

但是,如果没有原始文件,这些文件本身无法打开,从第一个链接来看:

您无法单独打开和查看 FDF 文件或 XFDF 文件。

我想将评论导出为仅包含评论文本的文本文件。

答案1

这有点复杂,但确实有效。
按照此处的说明导出评论并将其导出到荧光荧光蛋白文件:

  1. 将文件的扩展名重命名为 XML(例如,如果文件名为“comments.xfdf”,则将其名称更改为“comments.xml”。

  2. 使用谷歌浏览器打开 XML 文件。

  3. 全选 ( Ctrl+ A) 然后复制 ( Ctrl+ C)。

  4. 打开一个新的 Chrome 窗口并导航到此链接(它会创建一个空白记事本):

     data:text/html,%20<html%20contenteditable>
    
  5. 单击白色区域并粘贴(Ctrl+ V)。

  6. 全选(是的,再次选择Ctrl+ A)。

  7. 复制 ( Ctrl+ C)。

  8. 粘贴到 Word 文档中。

笔记:它可能适用于其他浏览器,但至少对我来说,当从 Firefox 复制/粘贴时,我最终会在 Word 中得到所有的 XML 代码。

答案2

  • 在 Notepad++ 中打开 fdf 文件

  • 替换<body[^>]*>(.*?)<\/body>22222\133333(不要忘记将搜索模式设置为正则表达式和“匹配换行符”)

  • 放在33333文档开头

  • 放在22222文档末尾

  • 替换33333(.*?)22222为空字符串

  • 将文件保存为 .html 文档,在浏览器中打开

  • 瞧!

33333 和 22222 可以是任意序列,只要它不出现在您的评论中。

相关内容