我们的 Plesk Linux Ubuntu 64 位邮件服务器负载极高,我们不知道如何隔离它。两周前负载还好,但最近两周负载严重恶化。
邮件服务器已经运行多年,偶尔会出现性能问题。通常,我们会通过关闭所有垃圾邮件检查来减少负载,直到问题得到解决(有时会自行解决)。
目前我们已经关闭实时阻止列表和 SPF 检查,并且我们已尝试关闭 SpamAssassin。
无论我们做什么,SpamAssassin 复选框都会在 GUI 中保持选中状态。出于无奈,我们已停止使用 /etc/init.d/psa-spamassassin。多年来,我们一直无法使用 SpamAssassin,因为它会杀死服务器。我们想使用它,但现在性能更重要。
我们无法关闭灰名单。一旦我们关闭灰名单,我们的帮助台就会接到大量电话。出于无奈,我们研究了截断灰名单数据库(现在已达到 2.5 GB),但在注意到关闭灰名单根本无法提高性能后,我们放弃了这一方法。
我们没有防病毒软件。它只会增加负载,而且 Dr. Web 对我们来说效果并不好。但如果它能有所作为,我们会尝试一下。
我们已经实施了 Postfix Anvil。这似乎使情况变得更糟,因此我们禁用了它。我们不确定是否是这种情况。
我们当前的邮件服务器配置为将所有 SMTP 转发到中继服务器。我们这样做是为了减少负载。这很有帮助,因为传出队列通常为空。
我们正在运行 Expand 配置。邮件服务器有大约 12,000 个帐户,其中可能有一半处于活动状态。
我们已阅读过此文件: http://www.postfix.org/STRESS_README.html 但是设置太多,我们不知道该选择哪一个。
请紧急协助。我们需要有关如何在所有客户放弃之前解决此问题的建议。
我们唯一的线索是,有数百个这样的过程:
30 13205 1 0 13:18 ? 00:00:00 /usr/lib/plesk-9.0/postfix-queue 127.0.0.1 10027 队列前 30
13207 1 0 11:38 ? 00:00:00 /usr/lib/plesk-9.0/postfix-queue 127.0.0.1 10027 队列前 30 13208 1 0 13:18 ? 00:00:00 /usr/lib/plesk-9.0/postfix-queue
127.0.0.1 10026 远程之前 30
13209 1 0 11:38 ? 00:00:00 /usr/lib/plesk-9.0/postfix-queue 127.0.0.1 10026 远程之前 30
13213 1 0 13:18 ? 00:00:00 /usr/lib/plesk-9.0/postfix-queue 127.0.0.1 10027 队列之前
答案1
问题可能是由几天内出现的延迟引起的。起初,大约 9 天的时间里,Perl 备份过程运行正常,但在工作时间负载很重时并不总是能完成。我有一个 +- 60 GB 的备份文件。
我们做到了
杀死-9
Perl 处理了这个问题,但糟糕的性能仍然存在。最后我们重启了服务器,除了 spamcop 之外还添加了 spamhaus RBL。重启后,服务器恢复正常负载。
我们向 Parallels 咨询了 75 美元,他们说磁盘性能不佳。隔离过程的下一步将是 SAS 或另一个高性能驱动器。