我在基于 intel (icelake) 的服务器上使用 Linux 内核 4.19。有时,在 Linux 启动后(在登录提示符处),它会立即卡住(一次是 50 次重新启动左右)。它不响应串行终端或监视器上的任何内容。卡住时,键盘大写锁定灯不亮也不灭。它甚至不接受 sysrq 请求。唯一的恢复方法是重置服务器。
我调试过,尝试过死锁调试,但没有帮助。该问题在 10 次或有时 50 次重新启动后随机发生。没有回溯或 oops 消息。在什么类型的情况下会发生这种情况?是否有可能在中断上下文中死锁?如果是,调试这个的最佳方法是什么?或者可能是某种类型的硬件问题?我还能做些什么来进一步调试这个问题?