如何区分 case 语句中的大写和小写字符？

Question 1

这是一个简单的答案，毫无疑问其他人可以取代。

现在，字符集排序因使用的区域设置而异。引入区域设置的概念是为了支持不同的民族及其不同的语言。正如您从输出中看到的，locale现在解决了几个不同的领域 - 不仅仅是整理。

在你的情况下，它是美国，出于排序和整理的目的，字母表是 AaBbCc...Zz 或 A=a、B=b、C=c 等（我忘记了哪个，而且我不在计算机上我可以验证其中之一）。区域设置非常复杂，并且在某些区域设置中可能存在对于排序和校对而言不可见的字符。根据使用的区域设置，相同的字符可以进行不同的排序。

正如您所发现的，识别小写字符的正确方法是使用[[:lower:]];这将在必要时包括重音字符，甚至不同字母表中的小写字符（希腊语、西里尔语等）。

如果您想要经典排序，您可以通过设置恢复每个应用程序甚至每个命令LC_ALL=C。举一个人为的例子，

grep some_pattern | LC_ALL=C sort | nl

Answer

这是一个简单的答案，毫无疑问其他人可以取代。

现在，字符集排序因使用的区域设置而异。引入区域设置的概念是为了支持不同的民族及其不同的语言。正如您从输出中看到的，locale现在解决了几个不同的领域 - 不仅仅是整理。

在你的情况下，它是美国，出于排序和整理的目的，字母表是 AaBbCc...Zz 或 A=a、B=b、C=c 等（我忘记了哪个，而且我不在计算机上我可以验证其中之一）。区域设置非常复杂，并且在某些区域设置中可能存在对于排序和校对而言不可见的字符。根据使用的区域设置，相同的字符可以进行不同的排序。

正如您所发现的，识别小写字符的正确方法是使用[[:lower:]];这将在必要时包括重音字符，甚至不同字母表中的小写字符（希腊语、西里尔语等）。

如果您想要经典排序，您可以通过设置恢复每个应用程序甚至每个命令LC_ALL=C。举一个人为的例子，

grep some_pattern | LC_ALL=C sort | nl

Question 2

字典顺序和 ASCII 顺序之间一直存在着一场持久的斗争。
许久。

从Unicode的角度来看，字符应该按照当地习惯进行排序字典顺序，因此 a A b B ... 表示美国字母（ASCII 字母）。这通常与 en_US.utf-8 语言环境中的 [a-zA-Z] 范围匹配。国际化通常也同意这一点。

从程序员的角度来看，由于 C 语言的原因，[az] 应该只匹配从 97 到 122 的 ascii 字符，如下所示一字节值。 [AZ] 也是如此。这通常与 C 语言将字符定义为一个字节相匹配。一些剧本作者想使用这个定义。

这场斗争时常从一种解释转变为另一种解释。
有时 [az] 范围仅变为abcdefghijklmnopqrstuvwxyz.
有时它会转变为aAbBcCdDeEfFgGhHiIjJkKlLmMnNoOpPqQrRsStTuUvVwWxXyYz.
或者其他一些更复杂的列表。

细节很复杂。历史悠久。战斗仍在激烈进行。

所以，你可能会得到（测试字符串book）：

对于 bash 版本 2、3 和 4，“你的字符串以大写字母开头”
bash 版本 5（和 1）的“你的字符串以小写字母开头”
大多数 shell 会将其报告为“小写字母”。

如果您测试字符串úber（在 en_US.UTF-8 中），您将得到：

ksh/ATT-sh 中的“小写”
dash、zsh、bash 5.0+ 或 [lm]ksh 中的“不是英文字母”。
bash 2、3 和 4 中的“大写字母”。

以及字符串Úber。

所以，结果是多种多样的。

您还可以设置 LC_ALL=C 来强制解释为a-z仅小写字母（并且A-Z仅是大写字母）。这会将用于的排序规则冻结为仅来自的排序规则C。如果区域设置发生变化，则不会发生任何变化。一个更健壮的脚本，但适应性较差的脚本。

还有一个选项可以使用[[:lower:]]，但同样，保证是 ASCII 范围 az仅有的在 C 语言环境中。在 POSIX 的未来版本（但尚未于 2020 年发布）中，它可能会强制应用于所有语言环境。

综合考虑，确保外部决定（来自 Unix 规范的 shell 开发人员）不会更改代码范围的唯一安全方法是：

# practicing case statements
echo "enter a string"
read yourstring
echo -e "your string is $yourstring\n"

low='abcdefghijklmnopqrstuvwxyz'
cap='ABCDEFGHIJKLMNOPQRSTUVWXYZ'

case "$yourstring" in
    [$cap]* ) echo "your string begins with a Capital Letter"   ;; 
    [$low]* ) echo "your string begins with a lowercase letter" ;; 
    *)      echo "your string did not begin with an English letter" ;;
esac

Answer