在具有多个部分的文件的一个部分中查找字符串

Question 1

首先我想到的既不是 sed 也不是 awk：

$ tr -d '\n' < file | grep -Po 'requestType : "UUID"\K.*? version : \K[0-9]*'
79

可能可以更容易地完成，特别是如果您可以保证“version”紧随“requestType”之后。

如果version不需要让requested Type事情变得更复杂一点：

$ tr -d '\n' < file | grep -Po '{.[^}]*?requestType : "UUID".*?}' | grep -Po 'version : \K[0-9]*'
79

如果有更多可以匹配所有部分的部分将被打印：

$ cat file
TESTVAR='
{
 icon : "icons/773_l.png",
 id : 80,
 initialState : true,
 isPng : false,
 label : "Imagery",
 opacity : 1,
 version : 79,
 requestType : "UUID"
}
,
{
 icon : "thisicon",
 id : 8080,
 initialState : false,
 isPng : true,
 label : "Boundaries",
 opacity : 1,
 requestType : "NothingSpecial",
 version : 8
}
,
{
 icon : "icons/773_l.png",
 id : 80,
 initialState : true,
 isPng : false,
 label : "Imagery",
 opacity : 1,
 requestType : "UUID",
 version : 87
}
,
{
 icon : "icons/773_l.png",
 id : 80,
 version : 17,
 initialState : true,
 isPng : false,
 label : "Imagery",
 opacity : 1,
 requestType : "UUID"
}
,
{
 icon : "thisicon",
 id : 8080,
 requestType : "NothingSpecial",
 initialState : false,
 label : "Boundaries",
 opacity : 1,
 version : 18,
 isPng : true
}

$ tr -d '\n' < file | grep -Po '{.[^}]*?requestType : "UUID".*?}' | grep -Po 'version : \K[0-9]*'
79
87
17

Answer

首先我想到的既不是 sed 也不是 awk：

$ tr -d '\n' < file | grep -Po 'requestType : "UUID"\K.*? version : \K[0-9]*'
79

可能可以更容易地完成，特别是如果您可以保证“version”紧随“requestType”之后。

如果version不需要让requested Type事情变得更复杂一点：

$ tr -d '\n' < file | grep -Po '{.[^}]*?requestType : "UUID".*?}' | grep -Po 'version : \K[0-9]*'
79

如果有更多可以匹配所有部分的部分将被打印：

$ cat file
TESTVAR='
{
 icon : "icons/773_l.png",
 id : 80,
 initialState : true,
 isPng : false,
 label : "Imagery",
 opacity : 1,
 version : 79,
 requestType : "UUID"
}
,
{
 icon : "thisicon",
 id : 8080,
 initialState : false,
 isPng : true,
 label : "Boundaries",
 opacity : 1,
 requestType : "NothingSpecial",
 version : 8
}
,
{
 icon : "icons/773_l.png",
 id : 80,
 initialState : true,
 isPng : false,
 label : "Imagery",
 opacity : 1,
 requestType : "UUID",
 version : 87
}
,
{
 icon : "icons/773_l.png",
 id : 80,
 version : 17,
 initialState : true,
 isPng : false,
 label : "Imagery",
 opacity : 1,
 requestType : "UUID"
}
,
{
 icon : "thisicon",
 id : 8080,
 requestType : "NothingSpecial",
 initialState : false,
 label : "Boundaries",
 opacity : 1,
 version : 18,
 isPng : true
}

$ tr -d '\n' < file | grep -Po '{.[^}]*?requestType : "UUID".*?}' | grep -Po 'version : \K[0-9]*'
79
87
17

Question 2

awk 允许您定义记录分隔符，因此不要使用换行符（每行都是一条记录），而是使用“}\n”作为记录的结尾：

echo "$TESTVAR" |
gawk -v RS="}\n" '
    /requestType : "UUID"/ && match($0, /version : ([0-9]+)/, m) {print m[1]}
'

这是 GNU awk 特有的，用于 match() 函数。

可惜这不是有效的 JSON。然后你可以使用 JSON 解析器：

jq '(.[] | select(.requestType == "UUID")).version' <<JSON
[
 {
  "icon" : "icons/773_l.png",
  "id" : 80,
  "initialState" : true,
  "isPng" : false,
  "label" : "Imagery",
  "opacity" : 1,
  "requestType" : "UUID",
  "version" : 79
 }
 ,
 {
  "icon" : "thisicon",
  "id" : 8080,
  "initialState" : false,
  "isPng" : true,
  "label" : "Boundaries",
  "opacity" : 1,
  "requestType" : "NothingSpecial",
  "version" : 8
 }
]
JSON

Answer

awk 允许您定义记录分隔符，因此不要使用换行符（每行都是一条记录），而是使用“}\n”作为记录的结尾：

echo "$TESTVAR" |
gawk -v RS="}\n" '
    /requestType : "UUID"/ && match($0, /version : ([0-9]+)/, m) {print m[1]}
'

这是 GNU awk 特有的，用于 match() 函数。

可惜这不是有效的 JSON。然后你可以使用 JSON 解析器：

jq '(.[] | select(.requestType == "UUID")).version' <<JSON
[
 {
  "icon" : "icons/773_l.png",
  "id" : 80,
  "initialState" : true,
  "isPng" : false,
  "label" : "Imagery",
  "opacity" : 1,
  "requestType" : "UUID",
  "version" : 79
 }
 ,
 {
  "icon" : "thisicon",
  "id" : 8080,
  "initialState" : false,
  "isPng" : true,
  "label" : "Boundaries",
  "opacity" : 1,
  "requestType" : "NothingSpecial",
  "version" : 8
 }
]
JSON

Question 3

这是纯粹使用以下方法来做到这一点的一种方法sed：

$ sed -rn '/\{/{:a;N;/\}/{/requestType : "UUID"/s/.*version : ([0-9]+).*/\1/p;d};ba}' <<< "$TESTVAR"
79
$

这是改编自https://stackoverflow.com/a/18046021/2113226为了您的数据。

你提到这是一个javascript数据结构，所以我认为解析它的最可靠的方法是使用javascript。我安装了 Node.js 来执行此操作，但我认为任何命令行 javascript 解释器都应该能够执行如下操作：

$ echo "arr=[$TESTVAR]; console.log(arr.filter(function(elem) { return elem.requestType === \"UUID\"; })[0].version)" | node
79
$

免责声明

您必须确保这里的数据安全。我不太了解 javascript，但我认为如果输入数据字符串制作得当，代码注入是完全有可能的。

Answer

这是纯粹使用以下方法来做到这一点的一种方法sed：

$ sed -rn '/\{/{:a;N;/\}/{/requestType : "UUID"/s/.*version : ([0-9]+).*/\1/p;d};ba}' <<< "$TESTVAR"
79
$

这是改编自https://stackoverflow.com/a/18046021/2113226为了您的数据。

你提到这是一个javascript数据结构，所以我认为解析它的最可靠的方法是使用javascript。我安装了 Node.js 来执行此操作，但我认为任何命令行 javascript 解释器都应该能够执行如下操作：

$ echo "arr=[$TESTVAR]; console.log(arr.filter(function(elem) { return elem.requestType === \"UUID\"; })[0].version)" | node
79
$

免责声明

您必须确保这里的数据安全。我不太了解 javascript，但我认为如果输入数据字符串制作得当，代码注入是完全有可能的。

在具有多个部分的文件的一个部分中查找字符串

答案1

答案2

答案3

免责声明

相关内容