正则表达式查找 3 或 4 个数字

Question 1

有很多方法可以做到这一点。以下命令假设每一输入行只能有一个数字。我正在使用这个文件作为测试：

1844-PAL.Bak 
IMG_1959.bak  
ZER_1940.BAK  
PEN225.bak
word-1943.BAK

sed

$ sed -r 's/([^0-9]*)([0-9]*)([^0-9]*)/1:"\1", 2:"\2", 3:"\3"/' file
1:"", 2:"1844", 3:"-PAL.Bak "
1:"IMG_", 2:"1959", 3:"bak  "
1:"ZER_", 2:"1940", 3:"BAK  "
1:"PEN", 2:"225", 3:"bak"
1:"word-", 2:"1943", 3:"BAK"

perl

$ perl -lpe 's/([^\d]*)(\d*)([^\d])/1:"$1", 2:"$2", 3:"$3"/' file
1:"", 2:"1844", 3:"-"PAL.Bak 
1:"IMG_", 2:"1959", 3:"."bak  
1:"ZER_", 2:"1940", 3:"."BAK  
1:"PEN", 2:"225", 3:"."bak
1:"word-", 2:"1943", 3:"."BAK

grep

$ grep -oP '\d+' file
1844
1959
1940
225
1943

如果每行只有一种感兴趣的模式，您可以简化为

 $ sed -r 's/[^0-9]*([0-9]*).*/Matched: \1/' file
Matched: 1844
Matched: 1959
Matched: 1940
Matched: 225
Matched: 1943

或者

$ perl -lpe 's/.*?(\d+).*/Matched $1/' file
Matched 1844
Matched 1959
Matched 1940
Matched 225
Matched 1943

一般来说，对于正则表达式，少即是多。您应该始终尝试使用最简单的必要正则表达式。如果您不想捕获或匹配非数字字符，请将它们排除在正则表达式之外。

Answer

有很多方法可以做到这一点。以下命令假设每一输入行只能有一个数字。我正在使用这个文件作为测试：

1844-PAL.Bak 
IMG_1959.bak  
ZER_1940.BAK  
PEN225.bak
word-1943.BAK