用于协作文本的变体/缩写/连字检查器

用于协作文本的变体/缩写/连字检查器

我在与合作伙伴合作时,经常会遇到许多常见的错误,例如:

  • 拼写变化(advisor 与 advisor)
  • 不同的缩写(eg. 与 eg)
  • 单词连字符的不同形式(数据集与数据集与数据集)

有专业工具可以做到这一点,但也许有一些工具、附加组件或脚本(例如 Python、bash)可以发现这些一般错误?普通拼写检查器无法在我们的文本中发现这些细微的差异。有什么想法吗?

答案1

可能不是您要寻找的答案,但您可以创建正则表达式检查此类内容查克特克斯。您可以添加类似

(?!#Use! e.g.! instead! of! eg.)\beg[.]

到文件UserWarnRegex的部分~/.chktexrc。我承认这有点难以阅读,因为你使用!转义空格(\在 LaTeX 命令中用得很多,所以这不是一个好的选择)。无论如何,最初的(?!#...)警告消息是在找到正则表达式时显示的,在本例中为 \beg[.],它将匹配“eg”。

ChkTeX 的实际目的是对 (La)TeX 代码本身而不是文字进行健全性检查,但与任何工具一样,它可以被强制执行其他操作。:)

显然,最大的问题是你必须自己列出问题清单。我目前不知道有任何这样的清单,但我知道我见过几份“含糊其辞的词语”或“被动语态”或其他“要避免的事情”的清单。

现在我正在考虑这个问题,如果有一套半标准规则集(适用于各种语言和写作风格)人们可以从 ChkTeX 网站链接开始(并根据自己的喜好进行定制)可能会很好。

相关内容