有许多常用的二合字母和连字,如 ß、w、ffi、st、æ、dž、ch 等。
其中一些与其组成部分完全不同。例如,u
在包含的字符串中搜索应该返回 false,对于和的w
情况也类似。s
ß
但其中一些只是字形连字符。例如,f
在包含 的字符串中搜索 应该返回 true,搜索和 的ffi
情况也类似。s
st
但是冰岛语æ
、斯洛伐克语dž
或捷克语呢ch
?所有这些语言在字母表中的状态都是字母,并且排序顺序不同。现在,如果我分别搜索a
、,它们应该返回 false 吗?如果它们返回 false,它们就是在欺骗眼睛所见。如果它们返回 true,那么赋予它们字母状态有什么意义呢d
?c
关于这一点还有其他国际公认的标准吗?