如何使用 logstash 解析 audit.log

Question 1

快速搜索发现这在 github 上

AUDIT type=%{WORD:audit_type} msg=audit\(%{NUMBER:audit_epoch}:%{NUMBER:audit_counter}\): user pid=%{NUMBER:audit_pid} uid=%{NUMBER:audit_uid} auid=%{NUMBER:audit_audid} subj=%{WORD:audit_subject} msg=%{GREEDYDATA:audit_message} 
AUDITLOGIN type=%{WORD:audit_type} msg=audit\(%{NUMBER:audit_epoch}:%{NUMBER:audit_counter}\): login pid=%{NUMBER:audit_pid} uid=%{NUMBER:audit_uid} old auid=%{NUMBER:old_auid} new auid=%{NUMBER:new_auid} old ses=%{NUMBER:old_ses} new ses=%{NUMBER:new_ses}

粗略的审查表明这可能就是您正在寻找的东西。

Answer

快速搜索发现这在 github 上

AUDIT type=%{WORD:audit_type} msg=audit\(%{NUMBER:audit_epoch}:%{NUMBER:audit_counter}\): user pid=%{NUMBER:audit_pid} uid=%{NUMBER:audit_uid} auid=%{NUMBER:audit_audid} subj=%{WORD:audit_subject} msg=%{GREEDYDATA:audit_message} 
AUDITLOGIN type=%{WORD:audit_type} msg=audit\(%{NUMBER:audit_epoch}:%{NUMBER:audit_counter}\): login pid=%{NUMBER:audit_pid} uid=%{NUMBER:audit_uid} old auid=%{NUMBER:old_auid} new auid=%{NUMBER:new_auid} old ses=%{NUMBER:old_ses} new ses=%{NUMBER:new_ses}

粗略的审查表明这可能就是您正在寻找的东西。

Question 2

审计日志以一系列键=值对的形式编写，可以使用 kv 过滤器轻松提取。但我注意到，键msg有时会使用两次，并且也是一系列键=值对。

首先使用 grok 获取字段audit_type、audit_epoch和audit_counter（sub_msg第二个 msg 字段）

grok {
  pattern => [ "type=%{DATA:audit_type}\smsg=audit\(%{NUMBER:audit_epoch}:%{NUMBER:audit_counter}\):.*?( msg=\'(?<sub_msg>.*?)\')?$" ]
  named_captures_only => true
}

kv 用于提取除 msg 和 type 之外的所有 key=value 对，因为我们已经使用 grok 获得了该数据：

kv {
  exclude_keys => [ "msg", "type" ]
}

再次使用 kv 来解析 sub_msg 中的 key=value 对（如果存在）：

kv {
  source => "sub_msg"
}

date 用于将日期设置为audit_epoch中的值，使用日期格式UNIX将解析浮点数或整数时间戳：

date {
  match => [ "audit_epoch", "UNIX" ]
}

最后使用 mutate 删除冗余字段：

mutate {
  remove_field => ['sub_msg', 'audit_epoch']
}

您还可以重命名字段，如 sysadmin1138 建议的那样：

mutate {
  rename => [
    "auid", "uid_audit",
    "fsuid", "uid_fs",
    "suid", "uid_set",
    "ses", "session_id"
  ]
  remove_field => ['sub_msg', 'audit_epoch']
}

所有组合的过滤器如下所示：

filter {
  grok {
    pattern => [ "type=%{DATA:audit_type}\smsg=audit\(%{NUMBER:audit_epoch}:%{NUMBER:audit_counter}\):.*?( msg=\'(?<sub_msg>.*?)\')?$" ]
    named_captures_only => true
  }
  kv {
    exclude_keys => [ "msg", "type" ]
  }
  kv {
    source => "sub_msg"
  }
  date {
    match => [ "audit_epoch", "UNIX" ]
  }
  mutate {
    rename => [
      "auid", "uid_audit",
      "fsuid", "uid_fs",
      "suid", "uid_set",
      "ses", "session_id"
    ]
    remove_field => ['sub_msg', 'audit_epoch']
  }
}

Answer