因此,我在几台服务器上有几个磁盘,由于短暂的网络延迟而丢失了磁盘。根据 mount 和 /proc/mounts,磁盘是 rw。当我 sudo 或尝试访问有故障的安装时,我得到:
sudo: unable to stat /var: Input/output error
当我重新启动时,问题就解决了。但是我不知道我还有什么选项来检测这些错误......
我猜 dmesg 显示了一些信息,但该信息不会随着错误而消失......
目前服务器运行的是Centos 6-7,磁盘主要是xfs和nfs。
有任何想法吗?
答案1
这不是 RO FS,因此未ro
在 中列出/proc/mount
。
要么Input/output error
意味着读取或写入错误,要么意味着系统尝试访问不存在的扇区(因为磁盘上应存在多少块的信息中存在一些错误)。
如果这种情况发生的频率足以保证监控以检测错误,那么它发生的频率足以找到并修复发生这种情况的原因。