我认为我的服务器硬件有问题。我认为是主板的问题,因为我测试过 RAM,但无论如何,我会解释发生了什么。
我的 Exchange 服务器有 1 个私人存储(13GB)、1 个公共存储(8GB)Raid5,Exchange 存储位于单独的分区中,总大小为 38GB,大约有 10GB 可用空间。它是 32 位操作系统(win 2003 服务器标准),内存为 4GB。它有 2 个 E540 @ 2.50GHz 处理器
每天晚上 1 点到 5 点,Exchange 都会对其 Exchange 存储进行在线维护。问题是,每天晚上,当其中一个维护程序正在执行时,服务器就会冻结/锁定。当我上班并检查服务器时,服务器没有响应,屏幕只是锁定在卡住的屏幕保护程序上。
我之所以弄明白为什么会卡死,是因为我在凌晨 1 点登录后查看了 taskmgr,发现某个进程占用了大量内存,然后突然我与服务器的连接断开了。原来是 exchange 的问题。
所以我的问题是:Exchange 在此维护期间会做什么?我以为它基本上只是碎片整理。如果是这样的话,我可能必须将 Exchange 数据库移动到另一台计算机并每月执行一次脱机碎片整理之类的操作。
如果你给这台服务器分配一个庞大的任务……需要占用大量内存……它就会卡死。惠普在远程测试后认为它没有任何问题,不想再使用它。我怒不可遏。
任何想法或建议都将不胜感激。
答案1
在线碎片整理过程占用大量内存和磁盘 IO。它并不特别占用 CPU。就压力而言,我大胆猜测它对 I/O 子系统的压力比对 RAM 的压力更大。话虽如此,您自己的测试表明大 RAM 进程将导致硬锁。Windows 中的硬锁通常是某种非常低级的故障,这确实在某种程度上表明了硬件问题。它可能不完全是内存问题,也可能是内存插槽、芯片组中的一些热故障(HP 服务器中不太可能出现这种情况,但可能会发生),甚至是 CPU。
这些很难隔离,尤其是因为它似乎与负载有关。主板不是一个糟糕的诊断。
答案2
我不会将责任归咎于 Exchange - 您描述的服务器对于运行 Exchange 2003 来说已经足够了。为了便于比较,我们有一个类似规格的 Exchange 2003 服务器,邮箱存储比它大 10 倍以上,并且我们在在线碎片整理过程中没有遇到任何问题。
维护期任务记录在此 Microsoft 知识库(碎片整理是最耗费资源的)。既然你说任何“繁重”的工作将使服务器陷入瘫痪,不仅是 Exchange 维护期,我还会将责任归咎于一些有故障的硬件。
我不建议每月(或任何)对邮箱存储进行离线碎片整理,这只会让人烦恼。必须卸载存储才能进行离线碎片整理(因此在此期间不会有电子邮件),而且这会花费很长时间。