我在远程位置有一个生产 Ubuntu 服务器,它最近开始出现异常。
我怀疑是 RAM 错误,并且想要进行物理 RAM 检查,而无需重新启动、Live CD 或memtests
导致停机。
我知道在线 RAM 测试在术语上是矛盾的(因为完整的物理检查要求没有任何进程正在运行),但我想知道是否有任何方法可以进行随机物理检查,这可能会给出一些 RAM 故障的迹象。
谢谢,
亚当
答案1
听起来你关心的是正常运行时间。我过去所做的是制作一个虚拟机,镜像有问题的系统,并在单独的物理主机上运行。然后进行必要的诊断,然后在问题解决后恢复物理系统。如果您有另一个可以使用的系统,这只是针对您的情况的一个想法。
答案2
如果正常运行时间确实令人担忧,那么实际上只有一个答案。
- 购买替换 RAM
- 晚点走或早点来
- 将其换掉。
然后,您要么知道它是旧 RAM(并且可以在另一台机器上进行测试以将其深入到一台机器上),要么知道您还有更多的测试要做。
将故障的 RAM 留在生产箱中只会给您带来更多问题。