Syslog-NG 服务器上 RX 字节与 TX 字节（ifconfig）之间存在巨大差异

Question 1

需要明确的是，接收和德克萨斯州是收到和发送（而不是传输）。
即，流量分别发送到此主机（在其网络接口上接收）和从此主机发送（在其网络接口上发送）。

      RX packets:60451021996 errors:0 dropped:0 overruns:0 frame:0
      TX packets:158501574 errors:0 dropped:0 overruns:0 carrier:0
      collisions:0 txqueuelen:5000
      RX bytes:12508573129969 (11.3 TiB)  TX bytes:220148785267 (205.0 GiB)

在上面的示例中，该网络接口具有已收到比它拥有的数据多得多已传输。

如果这里发生的主要流量是其他主机向其发送日志，那么听起来它接收的数据比传输的数据多。

Answer

需要明确的是，接收和德克萨斯州是收到和发送（而不是传输）。
即，流量分别发送到此主机（在其网络接口上接收）和从此主机发送（在其网络接口上发送）。

      RX packets:60451021996 errors:0 dropped:0 overruns:0 frame:0
      TX packets:158501574 errors:0 dropped:0 overruns:0 carrier:0
      collisions:0 txqueuelen:5000
      RX bytes:12508573129969 (11.3 TiB)  TX bytes:220148785267 (205.0 GiB)

在上面的示例中，该网络接口具有已收到比它拥有的数据多得多已传输。

如果这里发生的主要流量是其他主机向其发送日志，那么听起来它接收的数据比传输的数据多。

Question 2

第 3 层计数器无法证明第 7 层（应用程序）上正在发生什么。可能您拥有更多的非日志流量，如 IP 存储或软件更新。或者过滤日志比您想象的更积极。

在日志服务器上进行几个小时的数据包捕获以获取样本。查找协议的比例，例如使用 Wireshark 的Statistics > Protocol Hierarchy。syslog 占多少百分比？

考虑暂时保存未过滤的日志条目以对其进行统计。这需要相当大的快速存储。像 Graylog 这样的日志搜索引擎可以接收您发送的尽可能多的消息，但代价是维护一个 Elasticsearch 集群。

将通过 syslog 传输的原始数据与 SIEM 进行比较。获取 syslog 数据采集与 SIEM 存储的实际比率。计算唯一主机名或 IP 地址的数量，并与您的清单进行比较。

如果任何主机也在本地存储日志消息，请选择一些并查询这些文件。查找应该到达 SIEM 的消息并确认它们确实到达了。（当存在中央日志记录时，本地日志并不理想，但也可以检查它们。）

Answer