我自己搭建了一个基于 Linux 的 NAS。它有多个大小和使用年限各异的驱动器,采用 LVM 配置,数据量约为 800GB。数据由一个简单的 Samba 服务器提供。
它运行正常,但在物理移动它之后,它出现了一个奇怪的故障:每当我在服务器上执行某些操作导致磁盘活动时,整个机器就会冻结难的. 这会切断与盒子的所有开放网络连接,并使其变得毫无用处。
如果我把机器放置几分钟,它似乎就会再次恢复正常,但显然这不是真正的解决方案。
系统日志或内核日志中没有错误或警告消息。如果我打开机器并让它运行几天而不会锁定。此后我停止了测试。
它不会立即冻结 - 显然它不会在启动时冻结,并且我通常可以通过 SSH 登录并在它死机前几分钟开始浏览几个日志文件。
我的问题是:
我可以进行哪些诊断测试来确定原因?
答案1
调试此类问题的典型方法是将调试内核设置为输出到 com 端口。将另一台计算机连接到端口并读取日志。这样,您就可以了解系统冻结时发生的情况。但这听起来像是某种驱动程序/硬件问题,而这些问题可能非常难以调试。