净化 Word 文档中的文本

净化 Word 文档中的文本

当我与其他人合作时,我通常会收到以 word 文档形式排版的文本。然而,当我复制和粘贴时,似乎总是有一些字符 - 找不到更好的词来形容,就是“搞砸了”pdflatex。

有没有办法消毒这些特殊字符并将它们替换为纯文本同源词?

'、双倍空格加空格,等等。

注意:我很可能指的是与编码相关的问题,但我不明白这一点 - 我的合作者也不明白。

附言:不知道这里与什么标签相关,所以如果您有能力的话,请适当地这样做。

答案1

按易用性顺序总结了以下评论:

  • \usepackage[utf8]{inputenc}
  • 在 OpenOffice Writer 中打开,使用 writer2latex 插件
  • 使用antiword然后pandoc转换为 tex。
  • 用于sed查找替换编码字符

相关内容