从数据块中提取特定值

Question 1

您不必cut按-c字符计数。相反，您可以cut使用指定的-d限制符。

grep '^<gc type="global"' <infile | cut -d\" -f4

80
81
82

这只得到"一行中的第四个分隔字段。因此，该字段可以是任意数量的字符（如果您愿意，也可以是数字），只要它们都不是双引号即可。

但如果你想要整条线，你也不必这样做。

sed -e'/^<gc type="global"/!{g;/./q;d;}' -e'h;$!d' <infile

Answer

您不必cut按-c字符计数。相反，您可以cut使用指定的-d限制符。

grep '^<gc type="global"' <infile | cut -d\" -f4

80
81
82

这只得到"一行中的第四个分隔字段。因此，该字段可以是任意数量的字符（如果您愿意，也可以是数字），只要它们都不是双引号即可。

但如果你想要整条线，你也不必这样做。

sed -e'/^<gc type="global"/!{g;/./q;d;}' -e'h;$!d' <infile

Question 2

假设数据是格式正确且结构良好的 XML 文档，如下所示

<?xml version="1.0"?>
<root>
  <gc type="global" id="80" totalid="80" intervalms="315080.595">
---Remaining data---------
 </gc>
  <gc type="global" id="81" totalid="81" intervalms="315080.595">
---Remaining data---------
 </gc>
  <gc type="global" id="82" totalid="82" intervalms="315080.595">
---Remaining data---------
 </gc>
</root>

可以使用 XMLstarlet 提取属性为的gc节点的数据，如下所示：id82

xmlstarlet sel -t -v '//gc[@id="82"]' file.xml

这将获取相关节点的内容gc，无论该节点恰好位于文档中的哪个位置。

Answer

假设数据是格式正确且结构良好的 XML 文档，如下所示

<?xml version="1.0"?>
<root>
  <gc type="global" id="80" totalid="80" intervalms="315080.595">
---Remaining data---------
 </gc>
  <gc type="global" id="81" totalid="81" intervalms="315080.595">
---Remaining data---------
 </gc>
  <gc type="global" id="82" totalid="82" intervalms="315080.595">
---Remaining data---------
 </gc>
</root>

可以使用 XMLstarlet 提取属性为的gc节点的数据，如下所示：id82

xmlstarlet sel -t -v '//gc[@id="82"]' file.xml

这将获取相关节点的内容gc，无论该节点恰好位于文档中的哪个位置。

Question 3

awk -F[=\"] '{
    a[FNR]=$0;
    if ($6>l && $0 ~ "<gc type=\"global\""){
        l=$6;f=1;s=FNR
    };
    if($0 ~ "</gc>" && f==1 ){
        e=FNR;f=0
    }}
    END{ 
    for (i=s;i<=e;i++) {
        print a[i]
}}'

这将打印从具有最大 id<gc type="global"开始的块。</gc>

所有行都保存到数组中，a键为FNR

如果第 6 个字段大于前一个字段并且该行包含 string ，则第一个if将设置标志f并将数组键开始变量设置s为。FNRid<gc type=\"global\"

接下来if重置标志并将数组键结束变量设置e为FNR如果该行包含字符串</gc>且f等于 1

仅当键值在和之间时才会打印END数组中的元素。ase

Answer

awk -F[=\"] '{
    a[FNR]=$0;
    if ($6>l && $0 ~ "<gc type=\"global\""){
        l=$6;f=1;s=FNR
    };
    if($0 ~ "</gc>" && f==1 ){
        e=FNR;f=0
    }}
    END{ 
    for (i=s;i<=e;i++) {
        print a[i]
}}'