我在 Ubuntu 系统上遇到了一些磁盘问题。它们一直处于只读模式。我们的系统在 5 个不同的滑雪胜地运行,其中 3 个现在出现了这个问题。
这些机器处理电影并运行网络服务器和一些其他基本服务。所有机器过去都配有普通的 SATA 磁盘。我们现在已经在两台机器上安装了 SSD 磁盘,到目前为止,它们还没有进入只读状态,而且已经运行了数周。有些度假村需要处理大量流量和数据,有些则较少。我们无法确定问题与磁盘类型之间的关系。
视频处理系统不是我们的,我们依靠合作伙伴来保持其运行。他们声称操作系统没有问题。我们负责硬件和整个系统。问题是我无法登录查看任何日志,合作伙伴也不会给我访问权限。我们想知道是什么原因导致磁盘进入只读模式,以便我们可以采取措施来解决这个问题。
我们已经做的事情:
- 将两台机器上的磁盘更换为 SSD => 现在运行良好
- 改善/修复接线以确保稳定的电源供应
- 在存在此问题的机器上运行内存测试=>未发现问题
- 更换了一台出现此问题的机器上的损坏 CPU。更换 CPU 后问题又出现了,因此我们还将磁盘换成了另一个普通磁盘,因为我们的 SSD 用完了。现在它已经运行良好 18 小时了。
我遇到了这帖子声称这可能是内核错误。对此有什么评论吗?
我今天将对其中一个被更换的磁盘进行检查。
很高兴收到所有反馈! - Abel
答案1
我的经验如下……
当 Linux 将磁盘转储为只读模式时,它试图保护磁盘,避免进一步损坏自身。因此,Linux 很可能发现驱动器存在问题,并试图为您保存其中的数据。
你应该尽可能备份数据,并在磁盘上运行 badblocks 和 smartctl 来查看是否存在任何问题
答案2
他们声称操作系统没有问题。我们负责硬件和整个系统。问题是我无法登录查看任何日志,而合作伙伴也不会给我访问权限。
您应该要求您的合作伙伴提供一份日志副本,以便诊断可能出现故障的硬件。如果您的合作伙伴不愿意提供帮助,那么他们就是您的对手,而不是您的合作伙伴,您应该寻找真正的合作伙伴。</soapbox>
这很可能是硬件问题:可能是硬件在负载下出现故障(即硬件故障),硬件有故障需要更换,或者计算机中的连接松动。
一种可能的缓解方法是购买更好的硬件,包括 RAID 和 UPS。