当我与其他人合作时,我通常会收到以 word 文档形式排版的文本。然而,当我复制和粘贴时,似乎总是有一些字符 - 找不到更好的词来形容,就是“搞砸了”pdflatex。
有没有办法消毒这些特殊字符并将它们替换为纯文本同源词?
’
用'
、双倍空格加空格,等等。
注意:我很可能指的是与编码相关的问题,但我不明白这一点 - 我的合作者也不明白。
附言:不知道这里与什么标签相关,所以如果您有能力的话,请适当地这样做。
答案1
按易用性顺序总结了以下评论:
\usepackage[utf8]{inputenc}
- 在 OpenOffice Writer 中打开,使用 writer2latex 插件
- 使用
antiword
然后pandoc
转换为 tex。 - 用于
sed
查找替换编码字符