我们的服务器 Supermicro SYS-6016T-U 经常崩溃,原因是https://bugs.centos.org/view.php?id=10642。
由于无法写入磁盘,因此无法保存崩溃信息。我也无法使用IPMI
kvm 控制台或ssh
运行 dmesg 登录。
如何配置它以将其错误保存到某个网络位置?(实际上,NetworkManager
也会崩溃,因此网卡可能会丢失其配置)或者也许 ipmi 设备有一些缓冲区?
我犯了一个错误,为软件 raid 保留了 100% 的磁盘空间。不确定现在是否可以使用 kdump
答案1
我认为你应该考虑配置内核转储。它运行新内核来捕获旧内核的状态,效果非常好。我曾用它来捕获内核崩溃数据,后来 RH 用这些数据修补了内核错误。
似乎还有一个方法可以解决您遇到的错误 - 将内核降级到 3.10.0-229.4.2