我正在运行一台运行 GPU 的机器,有时会导致机器冻结。当我查看 syslog 文件时,它显示内核已挂起:
"echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
我想创建一个脚本来检测内核中的活动,这样当内核挂起时,它会自动启动机器。但是,当我运行 bash 脚本并跟踪 syslog 文件并查找某些特定关键字(如 kernel)时,该脚本会在内核冻结时停止运行,因此它没有机会执行重启命令。
有没有办法跟踪内核活动,这样当它冻结时,它会自动重启?就像内核崩溃时自动重启一样。
问候