使用 sed 的正则表达式和管道命令

Question 1

传统的 UNIX 工具支持 BRE 或 ERE（基本或扩展正则表达式）。 POSIX 对两者进行了编码。维基百科他们解释道。大多数现代工具都扩展了 ERE，通常带有首先在 Perl 中引入的附加功能（称为聚合酶链式反应）。

ERE 扩展了 BRE 的功能，但不扩展语法。在BRE中，只有字符\[.*^$具有特殊含义，并且一些运算符（例如分组）$…$使用反斜杠。在 ERE 中，+?|()也很特殊，并且反斜杠后跟非字母数字字符从来都不是特殊的。

BRE 没有 Python/PCRE\d和\s.您可以使用传统的集合结构和字符类来表示这些字符集：\dis[[:digit:]]和\sis [[:space:]]。注意双括号：一个表示字符集，一个表示字符类；例如可以写“字母、破折号或下划线” [-_[:alpha:]]。

BRE 没有+运算符（某些 sed 实现支持\+作为 BRE 语法的扩展）；X+是相同的XX*。组和匹配计数需要额外的反斜杠。

因此，Python 的 BRE 等效项\s+ up \s+(\d{1,2}):(\d{1,2})是[[:space:]][[:space:]]* up [[:space:]][[:space:]]*$[[:digit:]]\{1,2\}$:$[[:digit:]]\{1,2\}$.请注意，您匹配了太多的空白：\s+并且空格表示至少两个空白字符。

您需要匹配整行，因为 sed 的s命令会重写该行。没有单独的命令可以写出从保存的组组装的字符串。纠正额外的空格，Python 代码片段的模拟是：

uptime | sed 's/^.*[[:space:]][[:space:]]*up[[:space:]][[:space:]]*\([[:digit:]]\{1,2\}\):\([[:digit:]]\{1,2\}\).*$/\1h\2m/'

与 Python 代码片段不同，这会提取第一个匹配项而不是最后一个匹配项，但这在这里并不重要。

的输出uptime坚持空格字符和 ASCII 数字，因此您可以简化正则表达式：

uptime | sed 's/^.* up  *\([0-9]\{1,2\}\):\([0-9]\{1,2\}\).*$/\1h\2m/'

uptime这仅匹配机器运行时间少于 1 天的输出。我将留下匹配天数作为练习。（提示：写两个表达式sed -e s/AS ABOVE/\1h\2m/ -e 's/EXERCISE/\1d\2h\3m/'：）

Answer

传统的 UNIX 工具支持 BRE 或 ERE（基本或扩展正则表达式）。 POSIX 对两者进行了编码。维基百科他们解释道。大多数现代工具都扩展了 ERE，通常带有首先在 Perl 中引入的附加功能（称为聚合酶链式反应）。

ERE 扩展了 BRE 的功能，但不扩展语法。在BRE中，只有字符\[.*^$具有特殊含义，并且一些运算符（例如分组）$…$使用反斜杠。在 ERE 中，+?|()也很特殊，并且反斜杠后跟非字母数字字符从来都不是特殊的。