最近,我有几个服务器在 EXT3 文件系统上遇到了写入错误,结果以只读方式重新挂载了文件系统。可以理解的是,这在生产服务器上会导致严重问题。重新启动时,文件系统会修复,但在大型分区上,这需要很长时间。修复文件系统并纠正几个错误后,服务器又可以正常运行了。
我该怎么做才能最大程度地减少这种情况发生的频率?我似乎找不到太多关于定期检查正在运行的服务器上的文件系统的信息。是否可以更改 EXT3/系统处理写入错误的方式?什么是明智的解决方案。
与此相关的所有服务器都运行 CentOS Linux 5.4 或 5.5。
答案1
不应该任何ext3 中根本没有写入错误,如果有,您应该检查是否存在硬件缺陷(最有可能是磁盘损坏或者可能是电缆问题)。
答案2
您可以使用选项安装文件系统-o errors=continue
。查看man mount
详细信息。但是,不建议这样做,我同意 SvenW 的观点。如果您有硬件 RAID 卡,请对其进行一些检查,强制它验证阵列的完整性。电缆怎么样?您确定它们完好无损吗?至于定期检查正在运行的服务器上的文件系统 - 必须卸载它们。如果可能的话,您可以选择一个晚上的时间。