是否有任何服务在后台运行,并执行 prime95 的工作(即,它不时测试服务器 CPU/RAM 的完整性)?
问候,肖恩。
附言:我之所以问这个问题,是因为我们的服务器最近有一些坏的 RAM,这最终导致我们所有的业务文件慢慢损坏。文件会被复制到内存中,然后在 RAM 中损坏,最后以损坏的状态复制回 RAID 1 硬盘。
答案1
这就是为什么您要为一级服务器上的 ECC RAM 和 RAM 镜像支付大笔费用的原因……
不过,像 SAN 测试硬盘一样测试 RAM 是一个很有趣的想法。不过我从未听说过这样的软件。抱歉。
Vista 及以上版本附带的 Windows Memory Tester 相当不错,但我现在更喜欢它而不是 MemTest+,主要是因为它的进度报告更容易阅读。我确实对我们收到的每台新机器都运行了它至少 24 小时。虽然它没有在服务器上发现任何错误,但它在 3 个开发人员工作站上发现了坏的 RAM 条,这些工作站经历了无法解释的 BSOD,更换 RAM 解决了他们的问题。
答案2
虽然测试 CPU 和 RAM 听起来是个好主意,但我认为您需要一个可以持续实时监控硬件的硬件级监控工具。戴尔有 DOMSA,惠普和 IBM 有自己的产品,还有第三方产品可供选择。