我如何知道我的文档中使用了哪些连字符?

我如何知道我的文档中使用了哪些连字符?

为了知道我可能考虑禁用哪些连字,我想知道我的文档中实际使用了哪些连字。(字体提供哪些连字是一个更普遍的问题;我为此创建了一个单独的问题:我的文档中使用的字体提供哪些连字符?

下面的代码

\RequirePackage{fix-cm}
\documentclass[12pt]{memoir}
\usepackage{fixltx2e}[2006/09/13]
\usepackage{microtype}


\begin{document}

flicker -- fingers affliction affidavit

\end{document}

将连接“fl”、“--”、“fi”、“ffl”和“ffi”,但不会连接“ff”或“---”。(我认为这涵盖了英语的标准。当然,en-dash(用于“--”)和 em-dash(用于“---”)通常不被视为连字符,但我至少见过有人这样称呼它们一些关于 (La)TeX 的文献,所以我将它们包括在这里。在这种情况下,这是合理的,因为 (La)TeX 将它们视为(创建/处理)连字。)我如何以自动化的方式找出这一点?pdflatex如果这很重要,我通常使用。

答案1

我想说你不可以,而且这绝不是件容易的事。

一开始,你对什么是连字、什么不是连字没有一个清晰的概念:从技术角度来看,你可以将一个或多个字形替换为一个或多个其他字形。然后西班牙语 ¿ 将算作“?”的连字——只是因为 TeX 将此输入转换为 ¿。但从印刷角度来看,只有一些字形算作连字:fl 组合是连字,但 — 不是。

其次:您可以在 tfm 中查找字体的替换(“连字”)规则。但我认为没有办法在应用这些规则之一时收到通知(这可能与 luatex 不同。在那里可以检查节点)。

但即使你能以某种方式标记所有由连字符过程产生的字形:这并不意味着所有连字符字形被标记。完全可以直接输入连字符:

\documentclass{article}
\usepackage[T1]{fontenc}

\begin{document}
ff \char"1B
\end{document}

因此,要真正获得有关 PDF 中使用的(连字)字形的完整信息,您必须检查此 PDF。

相关内容