如何从 emacs org-mode 导出可以在 Microsoft Word 中打开的 html

如何从 emacs org-mode 导出可以在 Microsoft Word 中打开的 html

我使用 Emacs(org-mode 导出)创建了一个 HTML 文件,我想在 Microsoft Word 中打开它。但是,Word 说无法打开该文件。错误消息的详细信息如下:

引用未定义的实体‘hellip’。

由于缺乏更好的解决方法,我进入文件并将所有出现的“&hellip ;”替换为“...”,但随后我收到了类似的‘nbsp’错误消息,依此类推。

让 emacs 以可以在 Microsoft Word 中打开的形式输出 org-mode 文件而不丢失格式的最简单方法是什么?

答案1

有很多方法可以做到这一点,因为 Org-mode 支持很多不同的格式,并且有如下工具潘多克在大多数这些格式之间进行转换。

我不确定最简单的方法,并且在 pandoc 中直接 org -> docx 转换时得到了一些奇怪的结果pandoc -s myfile.org -o myfile.docx,但仍然有很多其他选择。

从 .html 导出开始的一种方法是在浏览器中打开文件,然后将内容复制粘贴到 word 中。这样可以保留格式。另一种方法,在org-mode 邮件列表涉及删除.html 文件顶部的所有 xml 行,直到第一行是标签<html>

正如评论中提到的,您还可以导出到 .odt(Open Office Writer 格式)。这不需要安装 OpenOffice。我刚刚尝试使用 MS Word 2013。虽然我收到一条错误消息,指出由于 而无法打开文件unspecified error in content.xml line 261,但它能够从错误中恢复并将 .odt 文件转换为 word,同时保留格式。

相关内容