如何查看我的 DOCX 文档的 XML?

如何查看我的 DOCX 文档的 XML?

我想看到我的.docx纯粹XML格式。

各种应用程序(例如互联网浏览器和 Visual Studio)都会在 Word 中为我打开该文件。

我也尝试将文档重命名为.xml扩展名,但它只会在记事本中打开并显示一堆难以理解的文本。

答案1

这是一个压缩文件。将其重命名为.zip以 结尾即可查看。

答案2

在 macOS 上工作,并且不想安装任何软件来查看.docx文档中的 XML?只需打开终端并执行以下操作:

cd path/to/your/file.docx
unzip file.docx -d file-content

如上所述,.docx文件是“伪装”的 zip 文件,unzip在 macOS 上默认安装。使用它之后,你的文件夹将包含组成 Word 文档的file-content各种文件。.xml

答案3

我解压了 zip 文件并使用 Notepad++(插件/XML 工具/立即检查 XML 语法)编辑了 document.xml。Notepad++ 注意到我交换了元素,我将元素按更合乎逻辑的顺序排列并重复这些步骤,直到没有发现其他问题。然后我使用 Total Commander 将所有文件直接复制到 zip 中,最后将其重命名为 *.docx。Word 愉快地打开了该文件。

我的意思是,如果 Word 仍然拒绝打开文件,那么一个或多个 xml 文件中可能存在其他问题。提示:使用 IE 快速检查 XML 文件。如果您只看到纯文本,甚至什么都看不到,那么您可以肯定 xml 有问题。

答案4

今天刚了解到,你可以从 cygwin(类似 linux)命令行获取 foo.docx 中的原始 XML

unzip  -q -c 'foo.docx' word/document.xml

相关内容