使用 bash 从方括号中提取数字

Question 1

您只需一个grep命令。这是因为 GNU grep 允许您使用Perl 正则表达式（-P），支持零宽度环视断言（\K并且(?= )，在这种情况下）：

grep -oP '^\[\K\d+(?=\])' infile

如上所述，这会将输出发送到您的终端。要将其重定向到文件，请使用：

grep -oP '^\[\K\d+(?=\])' infile > outfile

该方法的优点是简洁明了。它匹配的文本

前面有 ( \K)
- 字符[（\[） --\是必需的，[否则在正则表达式中具有特殊含义
- 出现在行首的 ( ^)；
+由一个或多个（）数字组成（ \d）；
后面跟着 ( (?= ))
- 字符]( \]) – 与类似[，\强制]进行字面匹配。

Answer

您只需一个grep命令。这是因为 GNU grep 允许您使用Perl 正则表达式（-P），支持零宽度环视断言（\K并且(?= )，在这种情况下）：

grep -oP '^\[\K\d+(?=\])' infile

如上所述，这会将输出发送到您的终端。要将其重定向到文件，请使用：

grep -oP '^\[\K\d+(?=\])' infile > outfile

该方法的优点是简洁明了。它匹配的文本

前面有 ( \K)
- 字符[（\[） --\是必需的，[否则在正则表达式中具有特殊含义
- 出现在行首的 ( ^)；
+由一个或多个（）数字组成（ \d）；
后面跟着 ( (?= ))
- 字符]( \]) – 与类似[，\强制]进行字面匹配。

Question 2

使用sed：

< inputfile sed -n 's/^\[$[0-9]*$\].*$/\1/p' > out

指令分解：

< inputfile：将内容重定向inputfile至stdin
-n：抑制输出
> out：将内容重定向stdout至out

正则表达式细分：

s：执行替换
/: 启动正则表达式
^: 匹配行首
\[: 匹配一个[字符
\(：开始捕获组
[0-9]*：匹配任意数量的数字
\)：停止捕获组
\]: 匹配一个]字符
.*: 匹配任意数量的任意字符
$: 匹配行尾
/：停止正则表达式/开始替换
\1: 替换为第一个捕获组
/：停止替换
p：仅打印匹配的行

使用grep+ （如果您需要一种可以在 Ubuntu 和不支持 PCREtr的其他操作系统上运行的方法- 否则，请参阅grepEliah Kagan 的grep唯一版本)：

< inputfile grep -o '^\[[0-9]*\]' | tr -d '[]' > out

指令分解：

< inputfilein grep：将内容重定向inputfile至stdin
-oin grep：仅打印匹配项
-din tr：删除字符
> outin tr：将内容重定向stdout至out

正则表达式细分：

^: 匹配行首
\[: 匹配一个[字符
[0-9]*：匹配任意数量的数字
\]: 匹配一个]字符

Answer

使用sed：

< inputfile sed -n 's/^\[$[0-9]*$\].*$/\1/p' > out

指令分解：

< inputfile：将内容重定向inputfile至stdin
-n：抑制输出
> out：将内容重定向stdout至out

正则表达式细分：

s：执行替换
/: 启动正则表达式
^: 匹配行首
\[: 匹配一个[字符
\(：开始捕获组
[0-9]*：匹配任意数量的数字
\)：停止捕获组
\]: 匹配一个]字符
.*: 匹配任意数量的任意字符
$: 匹配行尾
/：停止正则表达式/开始替换
\1: 替换为第一个捕获组
/：停止替换
p：仅打印匹配的行

使用grep+ （如果您需要一种可以在 Ubuntu 和不支持 PCREtr的其他操作系统上运行的方法- 否则，请参阅grepEliah Kagan 的grep唯一版本)：

< inputfile grep -o '^\[[0-9]*\]' | tr -d '[]' > out

指令分解：

< inputfilein grep：将内容重定向inputfile至stdin
-oin grep：仅打印匹配项
-din tr：删除字符
> outin tr：将内容重定向stdout至out

正则表达式细分：

^: 匹配行首
\[: 匹配一个[字符
[0-9]*：匹配任意数量的数字
\]: 匹配一个]字符

Question 3

道路perl：

perl -ne 'print "$1\n" if /^\[([0-9]*)\].*/' testdata > out

或者awk：

awk 'match($0, /^\[[0-9]*\]/) {print substr($0, RSTART + 1, RLENGTH - 2)}' testdata > out

在两种情况下都使用了正则表达式：

^\[[0-9]*\]

解释

/^\[[0-9]*\]/
- ^断言字符串开头的位置
- \[与字符[逐字匹配
- [0-9]*匹配下面列表中的单个字符
  - 量词：*零次至无限次之间，尽可能多次，根据需要返回 [贪婪]
  - 0-90 到 9 之间的单个字符
- \]与字符]逐字匹配
_{（来源：debuggex.com）}

_{Debuggex 演示}

Answer

道路perl：

perl -ne 'print "$1\n" if /^\[([0-9]*)\].*/' testdata > out

或者awk：

awk 'match($0, /^\[[0-9]*\]/) {print substr($0, RSTART + 1, RLENGTH - 2)}' testdata > out

在两种情况下都使用了正则表达式：

^\[[0-9]*\]

解释

/^\[[0-9]*\]/
- ^断言字符串开头的位置
- \[与字符[逐字匹配
- [0-9]*匹配下面列表中的单个字符
  - 量词：*零次至无限次之间，尽可能多次，根据需要返回 [贪婪]
  - 0-90 到 9 之间的单个字符
- \]与字符]逐字匹配
_{（来源：debuggex.com）}

_{Debuggex 演示}

Question 4

python使用re模块的解决方案并考虑两种情况：

#!/usr/bin/env python2
import re
with open('/path/to/file.txt') as f:
    for line in f:
        digits_case_1 = re.search(r'(?<=^\[)\d+(?=\])', line)
        digits_case_2 = re.search(r'(?<=^\[)\d+(?=\].*\);$)', line)
        if digits_case_1:
            print 'Not considering ");" at end: ' + digits_case_1.group()
        if digits_case_2:
            print 'Considering ");" at end: ' + digits_case_2.group()

输出：

Not considering ");" at end: 581
Not considering ");" at end: 50
Considering ");" at end: 50

这里我考虑了两种情况，因为您的问题对我来说似乎不清楚。

digits_case_1将在行首打印匹配的数字[]，它不会考虑该行是否以结尾);。
digits_case_2[]仅当行以结尾时才会在行首打印之间的数字);。

Answer

python使用re模块的解决方案并考虑两种情况：

#!/usr/bin/env python2
import re
with open('/path/to/file.txt') as f:
    for line in f:
        digits_case_1 = re.search(r'(?<=^\[)\d+(?=\])', line)
        digits_case_2 = re.search(r'(?<=^\[)\d+(?=\].*\);$)', line)
        if digits_case_1:
            print 'Not considering ");" at end: ' + digits_case_1.group()
        if digits_case_2:
            print 'Considering ");" at end: ' + digits_case_2.group()

输出：

Not considering ");" at end: 581
Not considering ");" at end: 50
Considering ");" at end: 50

这里我考虑了两种情况，因为您的问题对我来说似乎不清楚。

digits_case_1将在行首打印匹配的数字[]，它不会考虑该行是否以结尾);。
digits_case_2[]仅当行以结尾时才会在行首打印之间的数字);。

使用 bash 从方括号中提取数字

答案1

答案2

答案3

答案4

相关内容