解析 apache 日志以排除 IP 范围

Question 1

一种简单粗暴的方法是使用 grep。

创建一个文件（范围.txt）你的范围是这样的：

192\.168\.0\.[0-9]*
10\.0\.0\.[0-9]*

要从已有的范围文件创建该文件，可以sed像这样使用：

sed -n -e 's/^\([0-9]*\)\.\([0-9]*\)\.\([0-9]*\)\.\([0-9]*\) .*$/^\1\\.\2\\.\3\\.[0-9]* /p' your-range-file > ranges.txt

然后使用 grep 排除与该文件中的模式匹配的行，如下所示：

$ grep -v -f ranges.txt apache-log-file.log

或者

$ cat apache-log-file.log | < do some pre cleaning > | grep -v -f ranges.txt

这可以帮助您入门，但如果查询应该经常运行并且在大日志文件上运行，那么它可能不是一个好的解决方案。

祝你好运！

Answer

一种简单粗暴的方法是使用 grep。

创建一个文件（范围.txt）你的范围是这样的：

192\.168\.0\.[0-9]*
10\.0\.0\.[0-9]*

要从已有的范围文件创建该文件，可以sed像这样使用：

sed -n -e 's/^\([0-9]*\)\.\([0-9]*\)\.\([0-9]*\)\.\([0-9]*\) .*$/^\1\\.\2\\.\3\\.[0-9]* /p' your-range-file > ranges.txt

然后使用 grep 排除与该文件中的模式匹配的行，如下所示：

$ grep -v -f ranges.txt apache-log-file.log

或者

$ cat apache-log-file.log | < do some pre cleaning > | grep -v -f ranges.txt

这可以帮助您入门，但如果查询应该经常运行并且在大日志文件上运行，那么它可能不是一个好的解决方案。

祝你好运！

Question 2

Log 是您的日志文件，iprange 是包含 iprange 的文件。解决方案的 Perl 部分获取 IP 地址的前 3 个组成部分，如果 ipranges 文件中不存在，则 for 循环将打印它：

for i in `perl -lne 'print $1 if (m/(\d{1,3}\.\d{1,3}\.\d{1,3})\.\d{1,3}/);' log`
> do
>  grep -q $i iprange || echo $i;
> done

Answer

Log 是您的日志文件，iprange 是包含 iprange 的文件。解决方案的 Perl 部分获取 IP 地址的前 3 个组成部分，如果 ipranges 文件中不存在，则 for 循环将打印它：

for i in `perl -lne 'print $1 if (m/(\d{1,3}\.\d{1,3}\.\d{1,3})\.\d{1,3}/);' log`
> do
>  grep -q $i iprange || echo $i;
> done

相关内容