请帮助我,这非常非常重要。
我有一台 CentOS 服务器正常运行了一个月。它是用LVM安装的。
今天发现无法连接MongoDB,重启服务失败。另外,当我输入su root
切换用户时,我等了很长时间但没有询问我的密码。我尝试将 mongodb 日志复制到我的主目录,但它说error reading 'mongod.log': Input/output error
所以我决定重新启动服务器看看是否有帮助。
这是否意味着我的 SSD (WD SN750) 已失效?四天前服务器运行正常,在我重新启动之前我仍然可以在其他文件夹中进行一些 IO 操作。不过,现在只能进入紧急模式了……
我怎样才能解决这个问题?上面有我的工作论文的重要数据。
答案1
从任何救援媒体(Live CD/PXE/其他)启动并运行并发布结果:
smartctl -A /dev/sda
向咨询https://en.wikipedia.org/wiki/SMART。对于可能失败的属性。通常最重要的是:重新分配的扇区数(必须相对较低)。
然后您可以将旧文件系统安装在某个地方,例如/mnt/system
并检查您的日志。我假设您至少有使用 的 CentOS 7 journald
,因此根据您的驱动器是 SATA 还是 NVME,您可以通过运行简单地检查是否存在任何 I/O 错误:
journald -D /mnt/system/var/log/journald | egrep 'sd|nvme'
我会不是如果您的磁盘确实出现故障,建议运行,badblocks
因为这样做可能会损坏更多数据。首先尝试使用ddrescue
检索数据,然后再执行其他操作。