马拉地语排序

马拉地语排序

我正在使用包创建马拉地语文档马拉地语。我想在文档末尾添加一个主题索引,我可以使用imakeidx 软件包。但我得到的索引的排序顺序不是马拉地语的标准字母顺序。但它是Unicode 图表可在unicode.org上获取。

我的 MWE 如下所示。它给出索引的输出如下

  • 韓國
  • 愛爾蘭
  • 愛爾蘭
  • 愛爾蘭人
  • 愛爾蘭人

但按照马拉地语的标准排序顺序,它应该是

  • 韓國
  • 愛爾蘭
  • 愛爾蘭人
  • 愛爾蘭
  • 愛爾蘭人

出现此问题的原因是,क्ष 和 ज्ञ 实际上是辅音群。它们分别由 क ् ष (U+0915 U+094D U+0937) 和 ज ् ञ (U+091C U+094D U+091E) 组成。因此,它们按其顺序排序。但在马拉地语中,它们作为特殊连接词放在字母表的最后。

有什么解决方案可以解决这个问题并在 LaTeX 中获取特定于语言的排序顺序?

虽然我在这里使用了特定的包(imakeidx),但我的问题是特定于语言的排序顺序,在任何需要对文本进行排序的情况下都可能遇到这个问题。

\documentclass[10pt,a4paper]{memoir}

\usepackage{imakeidx}
\makeindex[title=विषयसूची, name=W]
\usepackage{marathi}
\usepackage{hyperref}

\begin{document}
त्यांनी क्षमतेनिशी\index[W]{क्षमता} भारतातील जातीयतेवर\index[W]{जातीयता} कोरडे
ओढले आहेत.  नाटक  ही इतर कलांच्या\index[W]{कला} आश्रयाने जगणारी कला नाही.
भारतीय\index[W]{भारतीय} मूल्यव्यवस्थेला धोकादायक ठरेल असे ते म्हणतात. 
कला सर्वार्थाने ज्ञानदर्शी\index[W]{ज्ञानदर्शी} असली पाहिजे.
    
\printindex[W]

\end{document}

答案1

这不适用于 makeindex。您需要一个了解 unicode 的索引程序。我建议使用 upmendex。

创建一个样式文件W.ist(至少,你可以添加更多选项)

icu_locale "mr_IN"

禁用 imakeidx 的自动 makeindex 调用:

\makeindex[title=विषयसूची, name=W,noautomatic]

然后在lualatex运行之后,手动运行

upmendex -s W.ist W.idx

然后再次使用 lualatex。然后(在 texlive 2023 中)给出此索引(间距由组之间的 \indexspace 决定,可以调整):

在此处输入图片描述

相关内容