我发现自己又一次需要同时使用 LaTeX 和 Microsoft Word。我有 Acrobat XI,所以我想我会把它用作从 LaTeX 到 Word 转换的中间人。似乎我以前做过这项工作,但现在它只会产生大量乱码文本。
当前的工作流程:
- 在 TeXworks 中编写 LaTeX(来自 MikTeX)
- 使用“pdfLaTeX + MakeIndex + BibTex”设置排版
- 在 Acrobat Pro XI 中打开输出 PDF
- 转到文件->另存为其他->Microsoft Word->Word 文档
- 在设置中,取消选中“包含注释”和“如果需要,运行 OCR”
- 节省
一切似乎都很好,然后我打开输出的 Word 文档,发现所有文本都只是随机符号。有趣的是,格式似乎非常完美 - 列表是列表,链接仍然有效,页面布局看起来不错 - 只是文本不可读。我检查了一下,Acrobat 能够很好地搜索 PDF,并且将文本直接复制到 Word(通过剪贴板)也完全没问题。但是如果我选择“复制格式”并粘贴到 Word 中,我又回到了符号。
我怀疑这只是一个字体问题。我还假设这是一个相当普遍的问题,不一定是 Acrobat 特有的。我真的希望解决这个问题 - 输出的 Word 文档不需要完美,它只需要具有相同的文本和大致相同的格式。有没有想过在 MikTeX 中更改可能的设置,可能会产生一个 Acrobat 更容易处理的 PDF?
谢谢!
答案1
我通过在乳胶文档中使用解决了这个问题
\usepackage[T1]{fontenc}
\usepackage{lmodern}
第一个语句启用T1
字体编码,第二个语句启用现代乳胶字体。
我甚至一直在使用(仅)第一个语句(它本身并不能解决这个问题)但添加第二个语句确实解决了这个问题并且从 Acrobat Pro(在我的情况下是 X)保存的 Word 文档能够正确显示。
请参阅此处的答案https://tex.stackexchange.com/questions/115080/cannot-copy-text-from-the-simplest-pdf-file?rq=1询问更多细节。
答案2
在 LateX 文件中使用这些包可能有助于创建更好的可复制文本 PDF 文件。
- \usepackage[T1]{fontenc}
- \usepackage{lmodern}
生成 PDF 文件
使用 Microsoft Word 2013 或更高版本打开 PDF 文件
它将转换您的所有文本、图形和表格。但我对页面顶部/底部的脚注、书名、作者姓名部分有些困惑。
答案3
目前,最好使用数学家以最佳准确度将 LaTeX 生成的 PDF 转换为 Word。如果有人知道更好的选择,我很乐意测试它。