如何从文件中获取特定文本中的内容

Question 1

$ grep -oE '".*"' demo.txt | grep -oE '\w+' | sort -u
02
05
06
0698
07
abc

-o仅打印匹配行的匹配（非空）部分，每个此类部分位于单独的输出行上
-E将 PATTERN 解释为扩展正则表达式
".*"获取引号内的所有值
\w+1 个或多个字母/数字/下划线字符
sort -u获得独特的价值

Answer

$ grep -oE '".*"' demo.txt | grep -oE '\w+' | sort -u
02
05
06
0698
07
abc

-o仅打印匹配行的匹配（非空）部分，每个此类部分位于单独的输出行上
-E将 PATTERN 解释为扩展正则表达式
".*"获取引号内的所有值
\w+1 个或多个字母/数字/下划线字符
sort -u获得独特的价值

Question 2

这是一个使用的解决方案awk -v RS='' -F='"' -f script input_file

/value -= \[/ {
    split($0, data);
    count = split(data[2], values, "|");
    for (i = 1; i <= count; i++) {
        result[values[i]] = values[i];
    }
}

END {
    for (r in result) {
        printf r "|";
    }
    print "";
}

也可以通过以下方式完成sed：

sed -nr '/"/{s/[ "]//g;s/,/|/;G;s/\n//;x};${x; :a; s/([^|]+\|)(.*)\1/\2/; ta; p}' input

Answer

这是一个使用的解决方案awk -v RS='' -F='"' -f script input_file

/value -= \[/ {
    split($0, data);
    count = split(data[2], values, "|");
    for (i = 1; i <= count; i++) {
        result[values[i]] = values[i];
    }
}

END {
    for (r in result) {
        printf r "|";
    }
    print "";
}

也可以通过以下方式完成sed：

sed -nr '/"/{s/[ "]//g;s/,/|/;G;s/\n//;x};${x; :a; s/([^|]+\|)(.*)\1/\2/; ta; p}' input

如何从文件中获取特定文本中的内容

答案1

答案2

相关内容