提取键值

Question 1

和pcregrep：

extract_key_value() {
  pcregrep -Mo1 "(?sx)
   (?:
       \Q$1\E      # key literally
     | \"\Q$1\E\"  # same in double quotes
     | '\Q$1\E'    # same in single quotes
   )
   [=:]
   (?|  # branch reset
       '(.*?)'
     | \"(.*?)\"
     | ([^\"'\s]+)
   )"
}

-M：多行匹配（允许test:'foo\nbar'...）
-o1：输出第一个捕获组匹配的文本（见下文分支重置）。
(?sx)：启用s标志（.也匹配换行符）和x标志（允许带有注释格式的多行）
\Q$1\E（函数的第一个参数）的内容$1应按字面意思理解。假设它不包含\E自身。在类似于 ksh93 的 shell 中bash，您可以替换$1为来${1//\\E/\\E\\\\E\\Q}解决这个问题。
(?|.(.).|.(.).)分支重置。捕获组的编号在每个之后从 1 开始|，因此-o1将返回在任何交替中匹配的第一个捕获组。
'.*?'。.*?是的非贪婪变体.*，因此'.*'将匹配从'到之后的第一个'。
\s: 任何空白字符。

这并没有尝试解决像\xjson 中的编码、引号内引号嵌入这样的极端情况（根据语言的不同，做法也有所不同）。它不允许或两侧有:空格=。如果需要的话，所有这些都可以解决。这将取决于您尝试处理的确切输入的类型。

Answer

和pcregrep：

extract_key_value() {
  pcregrep -Mo1 "(?sx)
   (?:
       \Q$1\E      # key literally
     | \"\Q$1\E\"  # same in double quotes
     | '\Q$1\E'    # same in single quotes
   )
   [=:]
   (?|  # branch reset
       '(.*?)'
     | \"(.*?)\"
     | ([^\"'\s]+)
   )"
}

-M：多行匹配（允许test:'foo\nbar'...）
-o1：输出第一个捕获组匹配的文本（见下文分支重置）。
(?sx)：启用s标志（.也匹配换行符）和x标志（允许带有注释格式的多行）
\Q$1\E（函数的第一个参数）的内容$1应按字面意思理解。假设它不包含\E自身。在类似于 ksh93 的 shell 中bash，您可以替换$1为来${1//\\E/\\E\\\\E\\Q}解决这个问题。
(?|.(.).|.(.).)分支重置。捕获组的编号在每个之后从 1 开始|，因此-o1将返回在任何交替中匹配的第一个捕获组。
'.*?'。.*?是的非贪婪变体.*，因此'.*'将匹配从'到之后的第一个'。
\s: 任何空白字符。

这并没有尝试解决像\xjson 中的编码、引号内引号嵌入这样的极端情况（根据语言的不同，做法也有所不同）。它不允许或两侧有:空格=。如果需要的话，所有这些都可以解决。这将取决于您尝试处理的确切输入的类型。

Question 2

grep 的一个例子：

function extract_key_value() {
    egrep -o "$1[:=]['\"[:alnum:]]+" | egrep -o "['\"[:alnum:]]+$" | egrep -o "[[:alnum:]]+"
}

echo -e "on line 1\ntest:123 asasas\non line 3\ntest='abc'\non line 5" | extract_key_value test

Answer

grep 的一个例子：

function extract_key_value() {
    egrep -o "$1[:=]['\"[:alnum:]]+" | egrep -o "['\"[:alnum:]]+$" | egrep -o "[[:alnum:]]+"
}

echo -e "on line 1\ntest:123 asasas\non line 3\ntest='abc'\non line 5" | extract_key_value test

提取键值

输入1

输入2

输入3

输入4

输入5

提取键值

答案1

答案2

相关内容