我正在寻求有关如何从 100% 满载的 vSAN 中恢复的建议和意见(没有明显的恢复出厂设置选项)。我有一个 8 节点 ESXi 集群,完全在 vSAN 上运行。由于我不愿意接触的供应商的情况,总磁盘容量不足以满足存储要求。最终结果是 vSAN 撞上了 100% 利用率的墙,处理起来就像鸡蛋撞到瓷砖地板一样困难。由于主机本身也从 vSAN 启动/运行;当这种情况发生时,主机被锁定,其中几个主机崩溃,大大减少了已经满载的 vSAN 上的可用磁盘大小。我已经能够重新获得对某些主机的访问权限,但由于 vSAN 徒劳地试图重建阵列,磁盘颠簸严重,响应速度非常慢,vCenter 不可用,因此我只能使用 SSH 和 vCenter 胖客户端管理单个主机。这消除了我对 vSAN 对象的大部分控制,所以我发现我的恢复选项受到了严重限制。
几点:
- 我很清楚,将任何 SAN 技术的容量填满至 100% 都会导致灾难,所以我们不要考虑那些显而易见且无益的观察。
- 我理解并接受数据丢失在这里几乎是不可避免的,但我想在删除需要的数据的同时尽可能地保存数据,以便将集群恢复到功能状态。
- 制造商已建议将集群重置为出厂设置,但我见过很多社区可以提供更好答案的案例。
- 由于集群无法运行,我愿意承担风险并尝试通常不可能实现的激进想法。