自动填充 LaTeX 字符的重音符号/变音符号

Question 1

如果你愿意并且能够使用 LuaLaTeX，你可以使用它的process_input_buffer回调，它可以作为输入流的预处理器，前TeX 甚至开始其正常工作。用户只需用name_table合适的搜索和替换字符串填充 Lua 表即可。

\documentclass{article}

\directlua{

% -- Set up a Lua table with search and replacement strings:
  name_table = {
     { "L'?Hopital" , "L'Hôpital" },
     { "Erdos"      , "Erdős"     },
     { "Holder"     , "Hölder"    }, 
     { "Godel"      , "Gödel"     },
     { "Rene"       , "René"      },
  }
% -- Next, define the Lua function that does the actual work:
  function change_table_vals ( s )
    for _,j in pairs ( name_table ) do 
      s = s:gsub ( j[1] , j[2] ) 
    end
    return s
  end

}
%% assign the Lua function to the 'process_input_buffer' callback
\AtBeginDocument{\directlua{luatexbase.add_to_callback ( 
   "process_input_buffer" , change_table_vals , "change" )}}

\begin{document}
L'Hopital LHopital Erdos Holder Rene Godel
\end{document}

Answer

如果你愿意并且能够使用 LuaLaTeX，你可以使用它的process_input_buffer回调，它可以作为输入流的预处理器，前TeX 甚至开始其正常工作。用户只需用name_table合适的搜索和替换字符串填充 Lua 表即可。

\documentclass{article}

\directlua{

% -- Set up a Lua table with search and replacement strings:
  name_table = {
     { "L'?Hopital" , "L'Hôpital" },
     { "Erdos"      , "Erdős"     },
     { "Holder"     , "Hölder"    }, 
     { "Godel"      , "Gödel"     },
     { "Rene"       , "René"      },
  }
% -- Next, define the Lua function that does the actual work:
  function change_table_vals ( s )
    for _,j in pairs ( name_table ) do 
      s = s:gsub ( j[1] , j[2] ) 
    end
    return s
  end

}
%% assign the Lua function to the 'process_input_buffer' callback
\AtBeginDocument{\directlua{luatexbase.add_to_callback ( 
   "process_input_buffer" , change_table_vals , "change" )}}

\begin{document}
L'Hopital LHopital Erdos Holder Rene Godel
\end{document}

Question 2

由于 TeX 是一种可扩展的宏语言，Expl3 的正则表达式功能可以处理替换，比仅仅替换字符串更强大，因为它在标记列表级别工作并且可以看到内部控制序列。

各种输入快捷方式都可用，并且为了方便输入，整个document环境可以作为标记列表输入到正则表达式中：

困难的工作是保持查找（stringA）元素的唯一性（彼此之间以及与文本中的普通单词（部分）之间的唯一性）。

平均能量损失

\documentclass{article}
\usepackage{xcolor}
\pagecolor{green!3}
\usepackage{etoolbox}
\usepackage{xparse}
\usepackage{fontspec}

\DeclareTextFontCommand{\textjp}{\fnippon}
\AtBeginEnvironment{document}{\myauto}
\AtEndEnvironment{document}{\endmyauto}

\setmainfont{Noto Serif}
\newfontfamily{\fnippon}{NotoSerifCJKjp}[
Extension=.otf,
UprightFont=*-Regular,
%BoldFont=NotoSerifCJKjp-Bold.otf,
]
%==============================


%^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
\ExplSyntaxOn

\tl_new:N \l_myab_tl

\NewDocumentEnvironment { myauto } { +b }
{
    \tl_set:Nn \l_myab_tl { #1 } 
    \domyauto 
    \tl_use:N \l_myab_tl 
}
{}

\newcommand\dmr[2]{
\regex_replace_all:nnN { #1 } { #2 } \l_myab_tl
%   \tl_replace_all:Nnn 
%                   \l_myab_tl 
%                   { #1 } 
%                   { #2 }

}

\newcommand{\domyauto}{
\dmr{lhopital} {L'Hôpital}
\dmr{hoelder}{Hölder}
\dmr{goedel}{Gödel}
\dmr{rened}{René}
\dmr{erdos}{Erdős}
\dmr{kazkur}{Kazimierz\ Kuratowski}
\dmr{waclaw}{Wacław\ Sierpiński}
\dmr{zyg}{Zygmunt\ Janiszewski}
\dmr{jerzy}{Jerzy\ Różycki}
\dmr{golab}{Stanisław\ Gołąb}
\dmr{ariege}{Ariège}
\dmr{bdrhone}{Bouches-du-Rhône}
\dmr{cotedor}{Côte-d'Or}
\dmr{isere}{Isère}
\dmr{upperaustria}{Oberösterreich}
\dmr{Carinthia}{Kärnten}
\dmr{kanagawa}{\c{textcolor}\cB\{blue\cE\}\cB\{\c{textjp}\cB\{神奈川県\cE\}\cE\}}
\dmr{toyama}{\c{textcolor}\cB\{blue\cE\}\cB\{\c{textjp}\cB\{富山県\cE\}\cE\}}
\dmr{hironaka}{\c{textjp}\cB\{広中\ 平祐\cE\}}
\dmr{yoneda}{\c{textjp}\cB\{米田\ 信夫\cE\}}
%\dmr{}{}
}

\ExplSyntaxOff


\begin{document}
%\begin{myauto}
\section{lhopital}
The cat sat on the lhopital rule.

erdos hoelder goedel rened fullerene

golab, jerzy, zyg, waclaw, kazkur.

ariege, bdrhone, cotedor, isere, upperaustria, Carinthia

\section{kanagawa, toyama}

Heisuke Hironaka (hironaka), Nobuo Yoneda (yoneda).


%\end{myauto}
\end{document}

Answer

由于 TeX 是一种可扩展的宏语言，Expl3 的正则表达式功能可以处理替换，比仅仅替换字符串更强大，因为它在标记列表级别工作并且可以看到内部控制序列。

各种输入快捷方式都可用，并且为了方便输入，整个document环境可以作为标记列表输入到正则表达式中：

困难的工作是保持查找（stringA）元素的唯一性（彼此之间以及与文本中的普通单词（部分）之间的唯一性）。

平均能量损失

\documentclass{article}
\usepackage{xcolor}
\pagecolor{green!3}
\usepackage{etoolbox}
\usepackage{xparse}
\usepackage{fontspec}

\DeclareTextFontCommand{\textjp}{\fnippon}
\AtBeginEnvironment{document}{\myauto}
\AtEndEnvironment{document}{\endmyauto}

\setmainfont{Noto Serif}
\newfontfamily{\fnippon}{NotoSerifCJKjp}[
Extension=.otf,
UprightFont=*-Regular,
%BoldFont=NotoSerifCJKjp-Bold.otf,
]
%==============================


%^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
\ExplSyntaxOn

\tl_new:N \l_myab_tl

\NewDocumentEnvironment { myauto } { +b }
{
    \tl_set:Nn \l_myab_tl { #1 } 
    \domyauto 
    \tl_use:N \l_myab_tl 
}
{}

\newcommand\dmr[2]{
\regex_replace_all:nnN { #1 } { #2 } \l_myab_tl
%   \tl_replace_all:Nnn 
%                   \l_myab_tl 
%                   { #1 } 
%                   { #2 }

}

\newcommand{\domyauto}{
\dmr{lhopital} {L'Hôpital}
\dmr{hoelder}{Hölder}
\dmr{goedel}{Gödel}
\dmr{rened}{René}
\dmr{erdos}{Erdős}
\dmr{kazkur}{Kazimierz\ Kuratowski}
\dmr{waclaw}{Wacław\ Sierpiński}
\dmr{zyg}{Zygmunt\ Janiszewski}
\dmr{jerzy}{Jerzy\ Różycki}
\dmr{golab}{Stanisław\ Gołąb}
\dmr{ariege}{Ariège}
\dmr{bdrhone}{Bouches-du-Rhône}
\dmr{cotedor}{Côte-d'Or}
\dmr{isere}{Isère}
\dmr{upperaustria}{Oberösterreich}
\dmr{Carinthia}{Kärnten}
\dmr{kanagawa}{\c{textcolor}\cB\{blue\cE\}\cB\{\c{textjp}\cB\{神奈川県\cE\}\cE\}}
\dmr{toyama}{\c{textcolor}\cB\{blue\cE\}\cB\{\c{textjp}\cB\{富山県\cE\}\cE\}}
\dmr{hironaka}{\c{textjp}\cB\{広中\ 平祐\cE\}}
\dmr{yoneda}{\c{textjp}\cB\{米田\ 信夫\cE\}}
%\dmr{}{}
}

\ExplSyntaxOff


\begin{document}
%\begin{myauto}
\section{lhopital}
The cat sat on the lhopital rule.

erdos hoelder goedel rened fullerene

golab, jerzy, zyg, waclaw, kazkur.

ariege, bdrhone, cotedor, isere, upperaustria, Carinthia

\section{kanagawa, toyama}

Heisuke Hironaka (hironaka), Nobuo Yoneda (yoneda).


%\end{myauto}
\end{document}

Question 3

这通常是文本编辑器甚至操作系统的一项功能。例如，在 MacOS 上，您可以转到“设置|键盘|文本”并进行设置，这样如果您输入，lhopital它会自动将其更改为L'Hôpital您正在输入的位置。

Answer

这通常是文本编辑器甚至操作系统的一项功能。例如，在 MacOS 上，您可以转到“设置|键盘|文本”并进行设置，这样如果您输入，lhopital它会自动将其更改为L'Hôpital您正在输入的位置。

Question 4

简单的替代方法是使用 AutoHotKey 或其他东西（vimabbrev 命令等）进行替换，正如其他答案中提到的。

请记住，TeX 只是一种编程语言。

想想对于像 Python 这样的“普通”编程语言你会如何做......

• 运行另一个脚本，用您想要的新序列替换旧脚本中的所有字符序列，然后
• 执行新脚本。

在 LaTeX 中也可以这样做：

• 读取文件内容（无论是字面上\ior_str_get:NN还是通过类似于逐字扫描向前的技术）
• 使用类似的方法\str_replace_all:Nnn用新字符串替换旧字符串
• 使用\scantokens重新解释（exec在 Python 中）为 TeX 源代码。

对于 LuaTeX 等引擎，已经可以通过 Lua 预处理源代码，而无需单独的步骤，请参阅其他答案。

不用说，用 TeX 编程不是很舒服，大多数人更喜欢编写一个 Python/Lua 或其他脚本来在源代码中查找和替换。

更准确地说，对于诸如 Python 之类的语言，您可以使用ast将源代码解析为解析树，然后仅替换字符串等中的部分内容，但据我所知，TeX 不会输出任何解析树（大多数时候解析树的概念在 TeX 中甚至没有意义。）

然而，在 TeX 中，您可以在普通（文本）模式下重新定义字符以向前扫描字符。这意味着您可以定义L向前扫描（参见 \peek_N_type:TF和类似内容）以确定下一个字符是否是'Hopital 并进行适当的替换；但现在这L是一个活动字符，它可能会破坏各种其他东西（例如您不能在控制序列名称中使用它）

另一种方法是定义一些字符来◇执行前向扫描，但是如果您想输入，◇L'Hopital您也可以只输入\LHopital。

另一种方法是在字体文件中使用连字......

仅使用有限的字符集也可以有效地容纳欧洲语言。例如，我们再次考虑挪威语，但假设您想使用没有 æ 字符的键盘。您可以安排字体度量文件，以便 TEX 将 ae、o/、aa、AE、O/ 和 AA 解释为分别产生 æ、ø、˚a、Æ、Ø 和 ˚A 的连字符；您可以将字符 ˚a 和 ˚A 放入字体的 128 和 129 位置。

（TeXBook，第 45 页，第 8 章“您输入的字符”）

我不确定这种方法是否适用于新引擎（使用新字体格式），而且我绝对不知道如何创建这样的字体（即使你这样做，我认为你仍然需要输入L'Ho"pital或类似的东西？我猜没有太大的改进）。

Answer