我有许多 PDF 文件,其中包含数百条注释/评论,这些注释/评论是通过免费的 Adobe Acrobat Reader 创建的。通过阅读本官方指南,并浏览相关页面,我发现我可以以 FDF 文件或 XFDF 格式“导出”评论。
但是,如果没有原始文件,这些文件本身无法打开,从第一个链接来看:
您无法单独打开和查看 FDF 文件或 XFDF 文件。
我想将评论导出为仅包含评论文本的文本文件。
答案1
这有点复杂,但确实有效。
按照此处的说明导出评论并将其导出到荧光荧光蛋白文件:
将文件的扩展名重命名为 XML(例如,如果文件名为“comments.xfdf”,则将其名称更改为“comments.xml”。
使用谷歌浏览器打开 XML 文件。
全选 ( Ctrl+ A) 然后复制 ( Ctrl+ C)。
打开一个新的 Chrome 窗口并导航到此链接(它会创建一个空白记事本):
data:text/html,%20<html%20contenteditable>
单击白色区域并粘贴(Ctrl+ V)。
全选(是的,再次选择Ctrl+ A)。
复制 ( Ctrl+ C)。
粘贴到 Word 文档中。
笔记:它可能适用于其他浏览器,但至少对我来说,当从 Firefox 复制/粘贴时,我最终会在 Word 中得到所有的 XML 代码。
答案2
在 Notepad++ 中打开 fdf 文件
替换
<body[^>]*>(.*?)<\/body>
为22222\133333
(不要忘记将搜索模式设置为正则表达式和“匹配换行符”)放在
33333
文档开头放在
22222
文档末尾替换
33333(.*?)22222
为空字符串将文件保存为 .html 文档,在浏览器中打开
瞧!
33333 和 22222 可以是任意序列,只要它不出现在您的评论中。