从日志文件中提取不包含禁用行的查询

Question 1

grep首先，请注意，顺便说一句，您不需要对的调用：它可以无缝集成到awk调用中。

<logfile awk '/endQuery/ {print $3 " " $1}'

您可以在 awk 阶段过滤掉禁止的查询。将正在进行的查询存储在数组中，如果被禁止则将其删除，并且仅打印非禁止的查询。

<logfile awk '
    $2 == "startQuery" {q[$1]=1}        # store the names of active queries
    q[$1] && /banned/ {delete q[$1]}    # delete banned queries
    $2 == "endQuery" {
        if (q[$1]) print $3, $1;        # only report non-banned queries
        delete q[$1];
    }
' | sort -nr | head -n 3

Answer

grep首先，请注意，顺便说一句，您不需要对的调用：它可以无缝集成到awk调用中。

<logfile awk '/endQuery/ {print $3 " " $1}'

您可以在 awk 阶段过滤掉禁止的查询。将正在进行的查询存储在数组中，如果被禁止则将其删除，并且仅打印非禁止的查询。

<logfile awk '
    $2 == "startQuery" {q[$1]=1}        # store the names of active queries
    q[$1] && /banned/ {delete q[$1]}    # delete banned queries
    $2 == "endQuery" {
        if (q[$1]) print $3, $1;        # only report non-banned queries
        delete q[$1];
    }
' | sort -nr | head -n 3

Question 2

我已经设法制定以下内容：

diff <(grep "endQuery" logfile | awk '{print $1}') \
     <(grep "banned"   logfile | awk '{print $1}') | \
  grep "<" | awk '{print $2}' | xargs -I{0} grep "{0} endQuery" logfile | \
    awk '{print $3 " " $1}' | sort -nr | head -n3
1434 query3
1000 query2
100 query4

但是，它需要对日志文件进行 3 次 grep，这对于大型日志文件来说可能会很昂贵。

Answer

我已经设法制定以下内容：

diff <(grep "endQuery" logfile | awk '{print $1}') \
     <(grep "banned"   logfile | awk '{print $1}') | \
  grep "<" | awk '{print $2}' | xargs -I{0} grep "{0} endQuery" logfile | \
    awk '{print $3 " " $1}' | sort -nr | head -n3
1434 query3
1000 query2
100 query4

但是，它需要对日志文件进行 3 次 grep，这对于大型日志文件来说可能会很昂贵。

从日志文件中提取不包含禁用行的查询

答案1

答案2

相关内容