使 TeX PDF 与 Word 2016 导入兼容

使 TeX PDF 与 Word 2016 导入兼容

经过进一步的实验后,我改变了这个问题的焦点,而原始问题则留在了底部的引文中。

正如原始问题所指出的,Word 的较新版本(我认为从 2013 年起)支持将 PDF 导入可编辑格式(尽管显然不是 100% 忠实再现)。

然而,Word 似乎无法很好地播放我用 Tex 创建的 PDF,如果他们能很好地播放的话,我的主管就可以校对文档了,这将会很方便。

因此,我的问题是,两者之间有什么区别,或者需要对 TeX PDF 进行哪些操作才能让 Word 能够打开它?还是因为其他原因而无法打开?

根据之前的评论,我尝试了 LuaLatex 和 XeLaTeX,但同样的问题仍然存在(见屏幕截图)。然后我想这可能是由于在 OSX 上,TeXShop 的默认编码是拉丁语,但在将所有内容转换为 UTF-8 后,仍然没有区别 - 的结果表明file -I doc.tex文档是ASCII,根据我的研究,它已经是 的一个子集UTF8

我注意到的唯一另一个奇怪之处是,如果我尝试让 Word 打开该文档,将其视为ASCII,它会自动取消选中该框,并且不会呈现预览,而我可以选择任何其他编码(尽管预览显然是乱码)。

这里肯定有一些微妙之处我没注意到,因为PDF2DOCx.com能够对可以在 Word 中打开的整个 TeX 文档进行令人惊讶的忠实重建。

Word 的导入流程

(使用 Unicode UTF-8(Ascii)下的 PDF 排版并使用 XeLaTeX 导出)

在此处输入图片描述 在此处输入图片描述


我意识到这个问题已经被问过无数次了,但是我现在在兜圈子,而且很多帖子都很旧了,所以我想知道是否有一些关于转换 Tex 文件(排版,不是原始)或更好的是,将 PDF 转换为 Word 2013 或更高版本的 .docx 格式的最新信息?

具体来说,我正在寻找命令行工具,以便可以将其包含在工作流程中?

到目前为止,我已经尝试使用 Pandoc,但存在无法解决的 UTF-8 格式问题,并且无法从 PDF 转换。

如今,Word 已经能够原生打开 PDF,而且通常效果很好,但它似乎根本无法读取我的 LaTeX PDF(如果有人对这一点也有想法,我很乐意听听)。

尽管文档非常庞大且复杂,我使用在线转换器取得了一些出色的结果,但如果可能的话,我真的不想每次都使用它们——我认为这告诉我,只要它们在命令行上可用,这一定是可行的。

最近有人遇到过可能符合要求的工具吗?

相关内容