Kill -9 挂起，无法杀死进程（谋杀证明进程）

Question 1

我执行了 tail -n 50 /var/log/message ，遗憾的是我不再有输出，但看起来出现了严重的问题。许多内存位置以十六进制打印，大概它们的内容（难以理解的杂乱）在右侧。

它几乎可以是任何东西，这些内核转储的内容对于了解它是什么很重要。

例如，您可能遇到了硬件问题，例如磁盘不再响应请求。尝试运行已缓存在 RAM 中的程序可以正常工作，而运行需要从磁盘读取的程序可能会挂起。

也可能是您遇到了内核错误，或其他一些驱动程序问题，或者 RAM 中出现了错误的位翻转，或者几乎有任何其他不良硬件。如果驱动程序锁定了内核中的特定资源，然后遇到错误或错误并且无法正确解锁它，则尝试获取该锁的任何其他驱动程序或系统调用都会挂起。

这可能不是内核中的错误。例如，当使用 lvm 或 dmsetup 工具来管理磁盘时，您可能会遇到这种行为。它们都可以挂起一个设备，其结果是“只要该设备挂起，对该设备的任何进一步的 I/O 都将被推迟”。然后尝试访问该设备的程序将简单地在内核中阻塞。您可以使用“dmsetup suspend”手动触发此操作，或者当 LVM 工具遇到错误时，我意外地看到磁盘处于挂起状态。

如果这是一次性的事情，请不要担心。如果再次发生这种情况，请尝试仔细记录内核输出，以便找到其原因。第一个故障转储将是最重要的。如果这种情况发生很多次并且您无法获得输出，请考虑使用网络控制台将内核输出直接发送到另一台机器。

Answer

我执行了 tail -n 50 /var/log/message ，遗憾的是我不再有输出，但看起来出现了严重的问题。许多内存位置以十六进制打印，大概它们的内容（难以理解的杂乱）在右侧。

它几乎可以是任何东西，这些内核转储的内容对于了解它是什么很重要。

例如，您可能遇到了硬件问题，例如磁盘不再响应请求。尝试运行已缓存在 RAM 中的程序可以正常工作，而运行需要从磁盘读取的程序可能会挂起。

也可能是您遇到了内核错误，或其他一些驱动程序问题，或者 RAM 中出现了错误的位翻转，或者几乎有任何其他不良硬件。如果驱动程序锁定了内核中的特定资源，然后遇到错误或错误并且无法正确解锁它，则尝试获取该锁的任何其他驱动程序或系统调用都会挂起。

这可能不是内核中的错误。例如，当使用 lvm 或 dmsetup 工具来管理磁盘时，您可能会遇到这种行为。它们都可以挂起一个设备，其结果是“只要该设备挂起，对该设备的任何进一步的 I/O 都将被推迟”。然后尝试访问该设备的程序将简单地在内核中阻塞。您可以使用“dmsetup suspend”手动触发此操作，或者当 LVM 工具遇到错误时，我意外地看到磁盘处于挂起状态。

如果这是一次性的事情，请不要担心。如果再次发生这种情况，请尝试仔细记录内核输出，以便找到其原因。第一个故障转储将是最重要的。如果这种情况发生很多次并且您无法获得输出，请考虑使用网络控制台将内核输出直接发送到另一台机器。

Question 2

停止一个进程就是这样kill做的。我认为运行kill -9 PID并等待它获得足够的资源来处理是正确的答案。

如果您认为进程占用了内存，您还可以手动调用 OOM Killer：

echo f > /proc/sysrq-trigger

Answer

停止一个进程就是这样kill做的。我认为运行kill -9 PID并等待它获得足够的资源来处理是正确的答案。

如果您认为进程占用了内存，您还可以手动调用 OOM Killer：

echo f > /proc/sysrq-trigger

Kill -9 挂起，无法杀死进程（谋杀证明进程）

答案1

答案2

相关内容