\documentclass{standalone}
\usepackage{fontspec,xstring}
\setmainfont[Script=Devanagari]{Shobhika}
\begin{document}
\StrChar{abcd}{1} % Returns a
\StrChar{क्ष}{1} % Returns क, but should return क्ष (क+्+ष)
\end{document}
我写的这个字符是一个由三个字符组成的“复杂字符”,但它们合在一起构成一个字符。这个特殊情况是连词。特别用于连接两个字符。还有另一种模式可以给我们完整的音节。辅音字符与元音变音符号组合形成一个音节。例如 /kā/ 将用辅音(k) 和元音变音符号(ā)्
书写,但合在一起将构成一个字符。这是因为梵文被称为क
ा
का
音节的(或字母音节)文字。在音节文字中,每个字符代表一个音节。
这是对天城文脚本工作原理的理论描述。因此,我认为天城文脚本需要不同的计数模式。算作“字符”的因素并不取决于符号的数量。构成单个字符的组合各不相同。TeX 是否还知道其他类似的字母音节脚本?由于各种原因,这个问题一次又一次地出现。我遇到了同样的问题biblatex
。你可以研究一下这里作为问题或与(已解决的)GitHub 问题相同的问题这里。我不知道他们是如何解决这个问题的,但 biber 的那个特定问题已经解决了。由于这个问题在不同的地方反复出现,我认为对梵文脚本进行不同的字符级别解释会更好,这种解释不是基于具有字母性质的脚本。
有任何想法吗?