将 LaTeX 转换为 Open Office / MS Word 格式的工作流程

将 LaTeX 转换为 Open Office / MS Word 格式的工作流程

我经常需要根据对某些数据的分析撰写报告。我使用 R 分析数据并导出表格、图形和文本。然后使用input或 Sweave 将其包含在 LaTeX 文档中(详情请参阅此处)。

但是,当我与他人合作时,有时我需要提供 Open Office / MS Word 格式的文档。

问题:

因此,假设最简单的情况

  • 我有一个包含文本、表格和图形的 LaTeX 文档
  • 我需要将其可靠地导出为 Open Office 或 MS Word 格式:其中包括数学公式、表格格式和质量数据)
  • 我不需要从 MS Word 返回到 LaTeX

什么是可靠、高效并且最好是免费的流程?

最初的想法:

我希望有一位专家已经制定出一个好的系统。

答案1

我为一个大型研发实验室实现了这个功能。我们每年制作数百份(甚至数千份)文档,那里的 LaTeX 用户社区希望能够使用 'tex 以及所见即所得软件制作文档。

楼主说得对,明确定义的工作流程至关重要。流程是其中的一部分,但您可能还需要考虑培训和使用通用存储库,以及如何实施企业设计。

过程

我们实施了一个流程,允许人们使用 LaTeX 工作,然后为合作者切换到 .docx。

  1. 使用以下方法定义包含正确格式等的类文件文章报告或者类。在类中包含最少数量的最新包,并添加nag包以确保您(和其他用户)可以看到这些包没有被弃用。
  2. 创建一个模板来展示如何使用类文件
  3. 为类和模板文件创建一个 SVN(或 git,或其他)存储库,并将存储库的 URL 分发给 LaTeX 用户
  4. 使用实验室标准类文件创建文档
  5. 使用以下方法将 tex 文件转换为 .docx潘多克适用于 Windows、Mac 和 Linux
  6. .docx
  7. 传输编辑内容.doc或者.docx将文档手动导入到'tex中,并在LaTeX中完成PDF制作。
  8. 使用 Adob​​e Acrobat 标记文档以符合第 508 条规定(可访问性)。

注意:使用以下基于 Web 的编辑器sharelatex.com或者overleaf.com可以消除 5-7 的需要,特别是现在他们有了相当好的审查工具。

挑战

为了使这一方案得以实施,我们必须面对一些挑战。

  1. 让编辑和审稿人找到适合他们现有流程的东西,因此使用 .docx格式
  2. 弄清楚如何让所有用户都能获得相同的类文件,因此有了 SVN 存储库
  3. 确保人们知道如何使用它,因此使用模板
  4. 找出让人们协作的工具。但那是另一篇文章了!

508 合规性/结构化 PDF

唯一一个仍然引起麻烦的是 508 合规性。我一直在(慢慢地)使用该pdfcomment包添加工具提示并修改accessibility包,以便可以访问文档。我的测试 PDF 文档有时会通过 Adob​​e Acrobat 中的自动测试...

存储库

我把一组演示文档放在Github 存储库这可能会有帮助。

关于 Pandoc 的注释

2017 年 12 月 3 日:我最初建议使用latex2rtf而不是 Pandoc。我现在编辑这个答案以建议使用 Pandoc,因为我发现 Pandoc 保持最新状态,运行良好,并且我喜欢从更多输入和输出文件类型中进行选择的灵活性。

答案2

我认为 LaTeX 不是合适的起始格式,特别是如果你使用 Sweave 生成​​输入文件。你可以考虑使用轻量级标记(Markdown、RST 等)作为起始格式。将这些格式转换为 LaTeX 和 OpenOffice 会容易得多(例如,使用潘多克)例如,请参阅这个 sweave 文件这是用 Markdown 编写的。我使用 sweave 对其进行了处理,做了一些后期处理,然后用 Pandoc 转换成 ConTeXt。由于后期处理后的文件完全是 Markdown 格式,所以转换成 OpenOffice 应该不成问题。

答案3

新版 Word(2013)允许您打开和编辑 PDF。工作流程如下:

  1. 使用 latex 和 pdflatex 制作 PDF
  2. 在 Word 2013 中打开 PDF
  3. 另存为 docx

答案4

我发现了一个将 LaTeX 文档转换为可编辑 Word 文件的非常简单的解决方案。

  1. 将您的 LaTeX 文档编译为 PDF
  2. 前往互联网页面http://pdftoword.com/
  3. 上传您的 PDF 并等待 Word 文件到达。

我只用文本文件(没有图形或公式)测试过该网站,但它将复杂的挪威语(æøå)合同转换为非常精确的副本。您会失去结构(没有样式,只有直接格式),但如果您需要发送 Word 文件进行校对等,它很有用。

我建议在 LaTeX 中将文本设置为右对齐。这样可以关闭连字(即不使用 ragged2e),这样 Word 文档将更易于编辑。

当然,稍后您必须将所有更改合并到您的 LaTeX 源中,但这仍然比重新输入文档要好。

为了良好秩序:我与 Nitro Software 没有任何联系,我甚至没有他们的程序副本。

相关内容