我有一个用 LaTeX 编写的书籍项目,我发现 TeX 生成的很多连字符都是错误的。扫描文档以查找所有连字符点会非常麻烦,所以我正在寻找一个可以从文档中收集所有连字符的工具。
我读过hyphen-show
,但显然它可以读取 DVI 文件。我使用 LuaTeX 直接生成 PDF,这可能意味着该工具对我没有帮助。
答案1
现在有一个工具可能正是您正在寻找的:lua-check-chyphen
。它会将所有使用过的带连字符的单词(包括所选的断点)写入一个额外的文件中。您可以选择在文档中标记这些连字符点,也可以使用外部文件(“白名单”)让 lua-check-hyphen 忽略这些断点进行检查。请参阅文档或者我的答案请参阅另一个问题以了解更多详细信息。
答案2
使用发现连接词。它的工作原理是您\tracingparagraphs=1
在处理 TeX 时进行设置,然后在日志文件上运行 perl 脚本来提取所有连字符。
答案3
我编写了一个小的 Python 程序查找连字符收集文本文件中所有连字符的信息。对于单列 pdf 文件,它与 的输出配合得很好pdftotext -layout
。