我们安装了一台新的 DELL 服务器,上面安装了(不支持的)Ubuntu 10.04 LTS。在安装 Ubuntu 之前,我们使用 DELL 工具配置了硬件 RAID(我认为是 RAID 1)。
服务器根本没有负载,一个小型 Postgres 服务器和一些 Samba 共享处于活动状态。有时硬盘似乎文件,ubuntu 将文件系统挂载为只读。
重新启动并运行 fsck 暂时有帮助,但问题一次又一次地出现。
今天我在发生此事时看到了一条错误消息(将一个大文件保存到硬盘):
end_request: I/O error, dev sda, sector 0
Aborting journal on device dm-0-8
EXT4-fs error (device dm-0): ext4_journal_start_sb: Detected a (...) journal
EXT4-fs (dm-0): Remounting filesystem read-only
EXT4-fs (dm-0):
EXT4-fs error (device dm-0): in ext4_da_write_end: IO failure
This should not happen!! Data will be lost
EXT4-fs (dm-0): ext4_da_writepages: jbd2_start: 1024 pages, in (...)1010855; err -30
在我看来,这似乎是硬件错误。您认为 RAID 可能是原因吗?安装了 FUSE 文件系统(实际上不再使用)?问题可能是因为此 DELL 服务器不支持 Ubuntu,那么使用 Windows 可以解决问题吗?
谢谢
答案1
听起来像是硬件问题。重启和 fsck 无法解决根本问题,请将服务器脱机以避免数据丢失并运行一些检查。
检查 RAID 硬件的启动实用程序,它们有时会有一个检查完整性的选项。要非常小心,因为一些低级完整性检查会破坏磁盘上的数据。检查任何 BIOS 日志是否有警告。
问题可能是阵列中的磁盘有故障(没有故障转移备份),请检查服务器上是否有不同颜色的指示灯。
根据您的磁盘控制器,您还可以在 Linux(ubuntu)中使用 GSmartControl 来让磁盘报告问题所在。