我想看到我的.docx
纯粹XML格式。
各种应用程序(例如互联网浏览器和 Visual Studio)都会在 Word 中为我打开该文件。
我也尝试将文档重命名为.xml
扩展名,但它只会在记事本中打开并显示一堆难以理解的文本。
答案1
这是一个压缩文件。将其重命名为.zip
以 结尾即可查看。
答案2
在 macOS 上工作,并且不想安装任何软件来查看.docx
文档中的 XML?只需打开终端并执行以下操作:
cd path/to/your/file.docx
unzip file.docx -d file-content
如上所述,.docx
文件是“伪装”的 zip 文件,unzip
在 macOS 上默认安装。使用它之后,你的文件夹将包含组成 Word 文档的file-content
各种文件。.xml
答案3
我解压了 zip 文件并使用 Notepad++(插件/XML 工具/立即检查 XML 语法)编辑了 document.xml。Notepad++ 注意到我交换了元素,我将元素按更合乎逻辑的顺序排列并重复这些步骤,直到没有发现其他问题。然后我使用 Total Commander 将所有文件直接复制到 zip 中,最后将其重命名为 *.docx。Word 愉快地打开了该文件。
我的意思是,如果 Word 仍然拒绝打开文件,那么一个或多个 xml 文件中可能存在其他问题。提示:使用 IE 快速检查 XML 文件。如果您只看到纯文本,甚至什么都看不到,那么您可以肯定 xml 有问题。
答案4
今天刚了解到,你可以从 cygwin(类似 linux)命令行获取 foo.docx 中的原始 XML
unzip -q -c 'foo.docx' word/document.xml