我有一个 Word 文档,其中包含大量嵌入图像。为了便于版本控制,我想将文档保存为 XML 并单独存储所有图像(链接)。
在 docx 格式中,图像单独存储在 zip 内,但我还没有找到使用未压缩文件的方法。
答案1
我从中提取了文件.docx
(将其重命名为.zip
)。然后我将文档保存为 Word XML,并在文本编辑器中删除了<pkg:package>
包含图像二进制数据的元素,并将标签添加TargetMode="External"
到<Relationship>
元素中。使用搜索和替换添加 TargetMode 非常容易,因为所有图像都命名为media/image...
。
之后我发现.gif
文件保存为.png
docx 格式,所以我必须在 xml 中更改这些文件的扩展名。
对于 Word 2013,您还需要更改标签<a:embed ...
以<a:link ...
使其正常工作(使用相对路径)。
答案2
您可以将 DOCX 文件重命名为 .zip,然后使用任何标准程序(如 Winzip)打开它。然后,您可以将 document\media 中的所有图像提取到硬盘中。从那里,您需要弄清楚如何自动(最有可能通过宏)将嵌入图像替换为硬盘上的链接图像。