我可以让 apache 仅记录请求的样本吗?

我可以让 apache 仅记录请求的样本吗?

我的 apache 日志文件变得太大了,我正在寻找使它们更易于管理的方法。

我知道我可以使用有条件记录仅记录对特定类型文件的访问,但记录请求的随机样本似乎更有意义,这样我仍然可以了解发生了什么,而不必记录每个请求。

有类似的东西吗?

我在 ubuntu 8.04 上安装了 apache 2,并且使用纪年法用于日志旋转。

答案1

我能想到三种减少日志文件大小的选项。

  1. 使用 gzip 压缩使日志更小。据我所知这是一个 syslogd 选项。
  2. 仅记录可能有用的内容。最干净的方式是根据完整 URL 消除您知道无用的请求(如图像、css、js 等)(这样您就可以阻止意外的黑客攻击)。
  3. 使 Apache 仅记录一部分流量。

实现此目的的一种可能方法是您提到的条件日志记录。现在条件日志记录使用 SetEnvIf Apache 功能。设置环境变量状态:

 SetEnvIf attribute regex [!]env-variable[=value] [[!]env-variable[=value]] ...

那么如何使用它来创建一个仅匹配 Remote_Addr 的“偶数”(或“奇数”)IP 地址的表达式呢?您可以通过进一步限制 IP 范围来进一步削减它。

当然,您也可以在这里查看问题的原因:是什么导致日志文件“太大”和“难以管理”?它们为您保存了什么信息?

答案2

为什么不更频繁地轮换日志?如果每周轮换给您太多日志,请每天轮换。如果每天轮换,请每小时轮换一次。此解决方案的问题在于日志分析器,如 webalizer:它们需要进行相应的配置。

我更喜欢记录一切,因为当你遇到问题时,你永远不会有太多的信息。而且考虑到实际的磁盘价格,对我来说不存在容量问题。

答案3

您可以通过 LogFormat 指令控制日志格式。

如果音量是问题,请考虑http://www.mrunix.net/webalizer/你可以通过 cron 任务运行它并生成漂亮的图形。我认为它甚至可以查看 logrorate 压缩的旧日志。

假设日志文件中的错误消息是随机分布的,您可以只打印日志中每 20 行的内容,例如

perl -ne 'print unless (0 != $. % 20)' logfile.txt

相关内容