使用 Awk 在 Bro 日志中搜索在线文本文件中找到的 IP/关键字

Question 1

我不完全确定你想要解析什么，因为我还没有看到输入格式，但是，如果你只想读取 IP 列表并打印到相应的输出文件，你可以尝试以下操作：

awk 'NR==FNR{a[$1]=NR; next} {
    for(ip in a){ 
        if($0~ip){ 
            print >> "line_"a[ip]"_ip.txt" 
        } 
    }
}}' <(wget -O - "https://zeustracker.abuse.ch/blocklist.php?download=badips" 2>/dev/null | 
    grep -Ev "#|^ *$") http.log

但这有点复杂，所以让我们分解一下：

wget -O - https://zeustracker.abuse.ch/blocklist.php?download=badips 2>/dev/null | grep -Ev "#|^ *$"：这将下载 IP 列表，删除任何包含#或为空的行并打印到标准输出。
<(command)：这就是所谓的流程替代和是一些 shell（bash、zsh 和 ksh，但也可能是其他 shell）具有的技巧，它使您能够将进程的输出视为另一个命令的输入文件。
因此，片段看到两个“文件”，第一个是命令管道awk的输出，第二个是文件。wgetgrephttp.log
NR==FNR{a[$1]=NR; next}: NR 是当前输入行号，FNR相同但不同当前文件。仅当读取第一个文件时，两者才相等。因此，这将创建一个数组，a其键是 IP，其值是当前行号。
for(ip in a)：迭代a数组，将其每个键（IP）保存为ip.
if($0~ip){}: 如果这一行 ( $0) 与此匹配ip。
print >> "line_"a[ip]"_ip.txt"：将该行打印到名为的文件中line_，显示该 IP 的输入行号以及_ip.txt.这>>可确保文件被追加且不会被覆盖。

Answer

我不完全确定你想要解析什么，因为我还没有看到输入格式，但是，如果你只想读取 IP 列表并打印到相应的输出文件，你可以尝试以下操作：

awk 'NR==FNR{a[$1]=NR; next} {
    for(ip in a){ 
        if($0~ip){ 
            print >> "line_"a[ip]"_ip.txt" 
        } 
    }
}}' <(wget -O - "https://zeustracker.abuse.ch/blocklist.php?download=badips" 2>/dev/null | 
    grep -Ev "#|^ *$") http.log

但这有点复杂，所以让我们分解一下：

wget -O - https://zeustracker.abuse.ch/blocklist.php?download=badips 2>/dev/null | grep -Ev "#|^ *$"：这将下载 IP 列表，删除任何包含#或为空的行并打印到标准输出。
<(command)：这就是所谓的流程替代和是一些 shell（bash、zsh 和 ksh，但也可能是其他 shell）具有的技巧，它使您能够将进程的输出视为另一个命令的输入文件。
因此，片段看到两个“文件”，第一个是命令管道awk的输出，第二个是文件。wgetgrephttp.log
NR==FNR{a[$1]=NR; next}: NR 是当前输入行号，FNR相同但不同当前文件。仅当读取第一个文件时，两者才相等。因此，这将创建一个数组，a其键是 IP，其值是当前行号。
for(ip in a)：迭代a数组，将其每个键（IP）保存为ip.
if($0~ip){}: 如果这一行 ( $0) 与此匹配ip。
print >> "line_"a[ip]"_ip.txt"：将该行打印到名为的文件中line_，显示该 IP 的输入行号以及_ip.txt.这>>可确保文件被追加且不会被覆盖。

Question 2

请注意，它bro是bro-cut从日志文件中提取数据的。

你可以这样做：

bro-cut id.orig_h id.resp_h < conn.log | grep -wFf <(
  curl 'https://zeustracker.abuse.ch/blocklist.php?download=badips' |
  grep '^[^#]'
)

和awk：

awk '
  NR == FNR {
    if (/^[^#]/) bad[$0]=""
    next
  }
  ($1 in bad) || ($2 in bad)
' <(curl 'https://zeustracker.abuse.ch/blocklist.php?download=badips') \
  <(bro-cut id.orig_h id.resp_h < conn.log)

（使用哈希表而不是在循环中进行艰苦的字符串匹配更有效）。

另请注意，新兴威胁规则集具有跟踪这些 Zeus 跟踪器列表（和其他列表）的规则。因此，如果除了 bro-ids 之外，您还使用带有该规则集的 snort/surricata，那么使用 bro 这样做最终会变得多余。

Answer