xindy：如何向字母表添加新字母和字母组？

Question 1

较长的文章

我已经准备了两个巴利语版本，供xindy：通用排序规则（英文排序规则加上几个新字母和一部分巴利文排序规则）和最小排序规则（仅适用于巴利文）。

我正在使用运行示例lualatex，这些示例xelatex也适用于。引擎使用拉丁现代排版。几个语音字母无法正确呈现，所以我使用了代码2000字体。如果您想运行pdflatex，请考虑使用iec2utf，这是由 michal-h21 编写的 Lua 脚本。

我使用了几种资源（如下所列）来获取巴利语单词作为测试用例。如果我拼错了一些单词，我深感抱歉。

这个问题。
http://urbandharma.org/pdf/palidict.pdf
http://en.wikipedia.org/wiki/Pali
http://www.budsas.org/ebud/dict-pe/
http://www.pratyeka.org/narada/
http://www.nibbanam.com/pali_language_tools.html，尤其是这个文件

1. 通用版本（部分西方语言加上巴利语的排序规则）

我想确保不仅字母会被添加，而且巴利语单词也会被正确排序。我从http://www.omniglot.com/writing/pali.htm和http://en.wikipedia.org/wiki/Pali。此外，我还记住了这个文件http://pratyeka.org/narada/pali_alphabets.pdf并且我在字母表中添加了几个音标符号，作为实验看看 Xindy 是否能够处理（它可以）。

我已经下载并安装代码2000字体以确保所有字母，特别是那些不常见的字母，都能正确显示。

我附上了一份包含 36 个字母组的列表：

% run: lualatex or xelatex typeset-paligeneral.tex
% Alphabet has 36 elements.
\documentclass[a4paper]{article}
\pagestyle{empty}
%\usepackage{luatextra}
%\usepackage{xltxtra}
\newenvironment{alphabet}{\begin{tabular}{*{16}{l}}}{\end{tabular}}
\addtolength{\voffset}{-0.5in}
\addtolength{\textheight}{2in}
\usepackage{fontspec}
% http://web.archive.org/web/20101122142710/http://code2000.net/code2000_page.htm
\setmainfont{Code2000}

\begin{document}
\section{Paligeneral}
\subsection{Alphabet}
\begin{alphabet}
a\,A & á\,Á & à\,À & ă\,Ă & â\,Â & ã\,Ã & ä\,Ä & ą\,Ą & å\,Å & æ\,Æ & ǽ\,Ǽ\\
ā\,Ā\\
b\,B\\
c\,C & ć\,Ć & ĉ\,Ĉ & ç\,Ç & č\,Č\\
d\,D & ð\,ð & đ\,đ & ď\,Ď\\
ḍ\,Ḍ & ɖ\,Ɖ\\
e\,E & é\,É & è\,È & ě\,Ě & ê\,Ê & ë\,Ë & ę\,Ę & þ\,Þ\\
f\,F\\
g\,G & ĝ\,Ĝ & ğ\,Ğ\\
h\,H & ĥ\,Ĥ & ı\,I\\
i\,I & í\,Í & ì\,Ì & î\,Î & ï\,Ï\\
ī\,Ī\\
j\,J & ĵ\,Ĵ\\
k\,K\\
l\,L & ĺ\,Ĺ & ł\,Ł & ľ\,Ľ\\
ḷ\,Ḷ & ɭ\,ɭ\\
m\,M\\
ṃ\,Ṃ & ŋ\,Ŋ & ɱ\,ɱ\\
n\,N & ń\,Ń & ň\,Ň\\
ṅ\,Ṅ & ɲ\,Ɲ\\
ñ\,Ñ\\
ṇ\,Ṇ & ɳ\,ɳ\\
o\,O & ó\,Ó & ő\,Ő & ò\,Ò & ö\,Ö & ø\,Ø & ǿ\,Ǿ & ô\,Ô & õ\,Õ & œ\,Œ\\
p\,P\\
q\,Q\\
r\,R & ŕ\,Ŕ & ř\,Ř\\
s\,S & ś\,Ś & ŝ\,Ŝ & ş\,Ş & š\,Š\\
t\,T & ť\,Ť\\
ṭ\,Ṭ & ʈ\,Ʈ\\
u\,U & ú\,Ú & ù\,Ù & ŭ\,Ŭ & ů\,Ů & û\,Û & ü\,Ü & ű\,Ű\\
ū\,Ū\\
v\,V\\
w\,W\\
x\,X\\
y\,Y & ý\,Ý & ÿ\,Ÿ\\
z\,Z & ź\,Ź & ż\,Ż & ž\,Ž
\end{alphabet}

\subsection{Ligatures}
\begin{flushleft}
`ß' is sorted like `s\,s', but \emph{after} it in otherwise equal words.
\end{flushleft}

\subsection{Upper-/lowercase words}
Capitalized or uppercase words are sorted \emph{before} otherwise equal lowercase words.

\subsection{Special characters}
The order of special characters and letters is:
\begin{flushleft}
?\hspace{4mm}!\hspace{4mm}.\hspace{4mm}letters\hspace{4mm}-\hspace{4mm}'
\end{flushleft}

\end{document}

mwe，通用版本，字母列表

用法

请将这两个文件下载到您的工作目录：

wget http://striz7.fame.utb.cz/tex-sx/pi/utf8.pl-paligeneral.in.xdy  
wget http://striz7.fame.utb.cz/tex-sx/pi/utf8.pl-paligeneral.in-test.xdy

我们在第一个示例上运行以下三行（mal-paligeneral.tex）：

lualatex mal-paligeneral.tex
xindy -M texindy -M utf8.pl-paligeneral.in-test -M bonus mal-paligeneral.idx
lualatex mal-paligeneral.tex

如果您想查看矢量版本，请下载：

wget http://striz7.fame.utb.cz/tex-sx/pi/typeset-paligeneral.pdf
wget http://striz7.fame.utb.cz/tex-sx/pi/mal-paligeneral.pdf

这是 TeX 文件的内容，我将在本文末尾附上它的预览，以便我们可以比较这两个版本。

% run: lualatex or xelatex mal-paligeneral.tex
% uncomment line 9 or 10, respectively
%
%lualatex mal-paligeneral.tex
%xindy -M texindy -M utf8.pl-paligeneral.in-test -M bonus mal-paligeneral.idx
%lualatex mal-paligeneral.tex
%
\documentclass[a4paper]{article}
\usepackage{luatextra} % for lualatex engine
%\usepackage{xltxtra} % for xelatex engine
\pagestyle{empty}
\usepackage{makeidx}
\makeindex
\usepackage[colorlinks]{hyperref}
\usepackage{filecontents}
\begin{filecontents*}{bonus.xdy}
(markup-letter-group :open-head "~n  \textbf{" :close-head "}")
\end{filecontents*}

\begin{document}
Regular text.
\index{pāḷi}
\index{ānāpānasati}
\index{saṃsāra}
\index{ñāṇavimutti}
% Pali Buddhist Dictionary
\index{insight}
\index{paññā}
\index{vipassanā}
\index{ñāṇa}
\index{nirvāṇa}
\index{nibbāna}
\index{permanency}
%\index{vipallāsa}
%\index{personality}
%\index{sakkāya}
%\index{diṭṭhi}
% sortedCanonList.txt
\index{aādiparokkhāyañca}
\index{sammāyojitajālavāta}
\index{ṃsati}
\index{ḷukhappa}
\index{homaidaṃ}
\index{sumanosmīti}
\index{sāmākanīvāre}
\index{vīriyārambhassa}
\index{jeṭṭhasissa}
\index{ñattikammavācāpi}
\index{ñattikammaṃ}
\index{ārammaṇamariyādā}
\index{aāgamo}
\begingroup
\def\thispagestyle#1{}
\printindex
\endgroup
\end{document}

2. 精简版本 (仅限巴利语)

这是字母表中使用的 41 个字母组的列表。

% run: lualatex or xelatex typeset-paliminimal.tex
% Alphabet has 41 elements.
\documentclass[a4paper]{article}
\pagestyle{empty}
%\usepackage{luatextra}
%\usepackage{xltxtra}
\newenvironment{alphabet}{\begin{tabular}{*{16}{l}}}{\end{tabular}}
\addtolength{\voffset}{-0.75in}
\addtolength{\textheight}{2in}
\usepackage{fontspec}
% http://web.archive.org/web/20101122142710/http://code2000.net/code2000_page.htm
\setmainfont{Code2000}

\begin{document}
\section{Paliminimal}
\subsection{Alphabet}
\begin{alphabet}
a\,A\\
ā\,Ā\\
i\,I\\
ī\,Ī\\
u\,U\\
ū\,Ū\\
e\,E\\
o\,O\\
k\,K\\
kh\,Kh\,KH\\
g\,G\\
gh\,Gh\,GH\\
ṅ\,Ṅ & ɲ\,Ɲ\\
c\,C\\
ch\,Ch\,CH\\
j\,J\\
jh\,Jh\,JH\\
ñ\,Ñ\\
ṭ\,Ṭ & ʈ\,Ʈ\\
ṭh\,Ṭh\,ṬH\\
ḍ\,Ḍ & ɖ\,Ɖ\\
ḍh\,Ḍh\,ḌH\\
ṇ\,Ṇ & ɳ\,ɳ\\
t\,T\\
th\,Th\,TH\\
d\,D\\
dh\,Dh\,DH\\
n\,N\\
p\,P\\
ph\,Ph\,PH\\
b\,B\\
bh\,Bh\,BH\\
m\,M\\
y\,Y\\
r\,R\\
l\,L\\
v\,V\\
s\,S\\
h\,H\\
ḷ\,Ḷ & ɭ\,ɭ\\
ṃ\,Ṃ & ŋ\,Ŋ & ɱ\,ɱ
\end{alphabet}
\subsection{Ligatures}
\begin{flushleft}
`ß' is sorted like `s\,s', but \emph{after} it in otherwise equal words.
\end{flushleft}
\subsection{Upper-/lowercase words}
Capitalized or uppercase words are sorted \emph{before} otherwise equal lowercase words.
\subsection{Special characters}
The order of special characters and letters is:
\begin{flushleft}
?\hspace{4mm}!\hspace{4mm}.\hspace{4mm}letters\hspace{4mm}-\hspace{4mm}'
\end{flushleft}
\end{document}

mwe，第 2 部分，最小版本

用法

请下载这两个文件：

wget http://striz7.fame.utb.cz/tex-sx/pi/utf8.pl-paliminimal.in.xdy
wget http://striz7.fame.utb.cz/tex-sx/pi/utf8.pl-paliminimal.in-test.xdy

我们运行这三行（为了进行比较，这些术语与第一个示例中使用的术语相同）：

lualatex mal-paliminimal.tex
xindy -M texindy -M utf8.pl-paliminimal.in-test -M bonus mal-paliminimal.idx
lualatex mal-paliminimal.tex

如果您想查看矢量版本，可以按如下方式下载 PDF 文件：

wget http://striz7.fame.utb.cz/tex-sx/pi/typeset-paliminimal.pdf
wget http://striz7.fame.utb.cz/tex-sx/pi/mal-paliminimal.pdf

这是第二个 TeX 文件的内容，并附上两个版本的预览。左侧是常规版本，右侧是最小版本，即单词列。

% run: lualatex or xelatex mal-paliminimal.tex
% uncomment line 9 or 10, respectively
%
%lualatex mal-paliminimal.tex
%xindy -M texindy -M utf8.pl-paliminimal.in-test -M bonus mal-paliminimal.idx
%lualatex mal-paliminimal.tex
%
\documentclass[a4paper]{article}
\usepackage{luatextra} % for lualatex engine
%\usepackage{xltxtra} % for xelatex engine
\pagestyle{empty}
\usepackage{makeidx}
\makeindex
\usepackage[colorlinks]{hyperref}
\usepackage{filecontents}
\begin{filecontents*}{bonus.xdy}
(markup-letter-group :open-head "~n  \textbf{" :close-head "}")
\end{filecontents*}

\begin{document}
Regular text.
\index{pāḷi}
\index{ānāpānasati}
\index{saṃsāra}
\index{ñāṇavimutti}
% Pali Buddhist Dictionary
\index{insight}
\index{paññā}
\index{vipassanā}
\index{ñāṇa}
\index{nirvāṇa}
\index{nibbāna}
\index{permanency}
%\index{vipallāsa}
%\index{personality}
%\index{sakkāya}
%\index{diṭṭhi}
% sortedCanonList.txt
\index{aādiparokkhāyañca}
\index{sammāyojitajālavāta}
\index{ṃsati}
\index{ḷukhappa}
\index{homaidaṃ}
\index{sumanosmīti}
\index{sāmākanīvāre}
\index{vīriyārambhassa}
\index{jeṭṭhasissa}
\index{ñattikammavācāpi}
\index{ñattikammaṃ}
\index{ārammaṇamariyādā}
\index{aāgamo}
\begingroup
\def\thispagestyle#1{}
\printindex
\endgroup
\end{document}

这是索引的预览，两个版本（左侧为通用版本，右侧为最小版本）

Answer