从行中提取多个模式，无论顺序如何

Question 1

使用awk（已测试GNU awk，不确定是否适用于其他实现）

$ cat kv.awk
/appID/ {
    for (i = 1; i <= NF; i++) {
        $i ~ /^port=/ && (a = $i)
        $i ~ /^authenticate=/ && (b = $i)
        $i ~ /^appID=/ && (c = $i)
    }
    print NR "\n" a, b, c
}

$ awk -v OFS='\t' -f kv.awk ip.txt
1
port=1234   authenticate=true   appID=dummyAppId1
2
port=1244   authenticate=false  appID=dummyAppId2
3
port=1235   authenticate=true   appID=dummyAppId3

和perl

$ # note that the order is changed for second line here
$ cat ip.txt
process1 port=1234 authenticate=true appID=dummyAppId1 <some more params>
process3 port=1244 appID=dummyAppId2 authenticate=false <some more params>
process2 port=1235 authenticate=true appID=dummyAppId3 <some more params>

$ perl -lpe 's/(?=.*(port=[^ ]+))(?=.*(authenticate=[^ ]+))(?=.*(appID=[^ ]+)).*/$1\t$2\t$3/; print $.' ip.txt 
1
port=1234   authenticate=true   appID=dummyAppId1
2
port=1244   authenticate=false  appID=dummyAppId2
3
port=1235   authenticate=true   appID=dummyAppId3

(?=.*(port=[^ ]+))第一个捕获组port
(?=.*(authenticate=[^ ]+))第二个捕获组，authenticate依此类推
print $.对于行号
为了避免部分匹配，如果单词边界足够，请使用等\bport。\bappID否则，使用(?<!\S)(port=[^ ]+)基于空格的限制。

如果您需要仅打印包含appID或任何其他此类条件的行，请更改-lpe为-lne并更改print $.为print "$.\n$_" if /appID/

Answer

使用awk（已测试GNU awk，不确定是否适用于其他实现）

$ cat kv.awk
/appID/ {
    for (i = 1; i <= NF; i++) {
        $i ~ /^port=/ && (a = $i)
        $i ~ /^authenticate=/ && (b = $i)
        $i ~ /^appID=/ && (c = $i)
    }
    print NR "\n" a, b, c
}

$ awk -v OFS='\t' -f kv.awk ip.txt
1
port=1234   authenticate=true   appID=dummyAppId1
2
port=1244   authenticate=false  appID=dummyAppId2
3
port=1235   authenticate=true   appID=dummyAppId3

和perl

$ # note that the order is changed for second line here
$ cat ip.txt
process1 port=1234 authenticate=true appID=dummyAppId1 <some more params>
process3 port=1244 appID=dummyAppId2 authenticate=false <some more params>
process2 port=1235 authenticate=true appID=dummyAppId3 <some more params>

$ perl -lpe 's/(?=.*(port=[^ ]+))(?=.*(authenticate=[^ ]+))(?=.*(appID=[^ ]+)).*/$1\t$2\t$3/; print $.' ip.txt 
1
port=1234   authenticate=true   appID=dummyAppId1
2
port=1244   authenticate=false  appID=dummyAppId2
3
port=1235   authenticate=true   appID=dummyAppId3

(?=.*(port=[^ ]+))第一个捕获组port
(?=.*(authenticate=[^ ]+))第二个捕获组，authenticate依此类推
print $.对于行号
为了避免部分匹配，如果单词边界足够，请使用等\bport。\bappID否则，使用(?<!\S)(port=[^ ]+)基于空格的限制。

如果您需要仅打印包含appID或任何其他此类条件的行，请更改-lpe为-lne并更改print $.为print "$.\n$_" if /appID/

Question 2

对于perl，您可以使用如下方法：

perl -lne 'my %h;
           $h{$1} = $& while /(\S+?)=(\S+)/g;
           print "@h{qw(port authenticate appID)}"'

您可以在其中构建一个哈希表，其键是属性名称，值是 s name=value，然后打印您想要的内容。

如果您只想输出值，请替换$&为。$2

awk与：相同

awk '
  {
    split("", h)
    for (i = 1; i <= NF; i++)
      if (n = index($i, "=")) h[substr($i, 1, n - 1)] = $i
    print h["port"], h["authenticate"], h["appID"]
  }'

使用pcregrep，您可以执行以下操作：

pcregrep -o1 -o2 -o3 --om-separator=' ' '(?x)
  ^(?=.*?\s(port=\S+))
   (?=.*?\s(authenticate=\S+))
   (?=.*?\s(appID=\S+))'

（这需要所有三个属性都存在）。

和sed：

sed 'G
     s/[[:space:]]\(port=[^[:space:]]*\).*\n.*/&\1/
     s/[[:space:]]\(authenticate=[^[:space:]]*\).*\n.*/& \1/
     s/[[:space:]]\(appID=[^[:space:]]*\).*\n.*/& \1/
     s/.*\n//'

最后两个假设属性不是该行的第一个单词（鉴于您的样本，这似乎是一个合理的假设）。

Answer