在我的 exim4 安装中,我不断收到 UTF-8 编码和扩展 ANSI 编码的主日志,其中包含字符串,如“tämä”(正确为 UTF-8)和“t\xe4\m\xe4”(ANSI)。后者的转义标记是单字节代码,为清晰起见进行了转义(“tämä”以字节为单位编码为 74 EC 6D EC)。当然,今天的默认设置是 UTF-8,大多数行都正常。
问题是这会让 fail2ban 感到困惑,因为它希望日志文件以一致的方式进行编码。但是,我无法选择 ANSI 或 UTF-8,因为日志文件中同时存在这两种编码。
我想知道是否有办法在将字符串记录到 /var/log/exim/mainlog 之前过滤掉 ANSI 字符?
至于罪魁祸首,可能是 Windows 机器上的一个古老的垃圾邮件软件或一些旧的群发邮件应用程序。无论如何,每天大约有 35-45% 的日志行似乎受到 ANSI 污染。