我有一台装有多个磁盘的 Ubuntu 10.04 服务器。这些磁盘设置了一个联合文件系统,它们都作为一个逻辑 /home 呈现。
几天前,其中一个磁盘似乎突然“变空”,原因不明。/home 挂载上的数据量在几分钟内几乎减半 - 在“变空”之前,该磁盘似乎有超过 400 GB 的数据。
我完全不知道发生了什么。其他时候我没有使用服务器,但有六个其他用户可能使用了(没有 root 权限,也没有能力对整个磁盘进行保护)。
我已经对磁盘进行了 SMART 测试,结果显示没有问题。文件系统检查正常(目前已使用 12 GB,因为一些用户软件在事件发生后仍在继续下载)。
我所知道的是,10 月 19 日午夜左右,磁盘使用情况发生了巨大变化:
数据点每 15 分钟一次,全部丢失发生在捕获之间:2012-10-18 23:58:03.399647 - 有 953.97/2059.07 GB [46.33%] 2012-10-19 00:13:15.909010 - 有 515.18/2059.07 GB [25.02%]
除此之外,我没什么可说的 :-(
我知道:
- 当时日志文件中没有什么有趣的东西
- 事件发生时似乎没有人通过 SSH 登录(大多数用户甚至不使用 SSH)
- 无论发生什么情况,服务器始终在线(正常运行时间为 3 个月)
- 其他磁盘均未受到影响,服务器上的其他一切看起来都完全正常
- 我尝试在磁盘上使用“extundelete”,但并没有找到任何东西(一些临时文件,但它们看起来是新的)
我完全不知道是什么原因造成的。我最初认为可能是 root 权限提升漏洞,但即使有人恶意“rm”磁盘内容,400 GB 也需要超过 15 分钟?
答案1
我无法猜测这是怎么发生的。
但要“彻底清除”磁盘,最快的方法是删除分区并重新创建分区。这样,您只需几秒钟就可以获得一个“干净”的“格式化”EXT4分区。
如果以某种方式使用根升级,这是一种方法。
答案2
恢复数据丢失之前的备份,并恢复昨晚的备份。比较两者。