我的 Linux 系统偶尔会莫名其妙地挂起。我该怎么办？

Question 1

可能是您的某个驱动器断开连接后重新连接，但被检测为新设备。根据我使用 Linux 服务器的经验，如果旧设备未正确断开连接且内核仍保留其字母，则有时会发生这种情况，当它重新连接时会为其分配一个新字母。可能是您的某个驱动器出现故障或电缆未固定。这实际上取决于控制器及其处理设备的方式。

由于您说您发现机器已经挂起，而您无法真正查看它发生了什么，我建议您编写一个小的 bash 脚本，不断提取有关所有驱动器的信息并将其写入文件，最好是写入您确定可以正常工作的驱动器之一，否则如果您尝试在故障驱动器上写入，则可能无法写入。脚本可能类似于：

#!/bin/bash 


date
echo "Starting device data dump" 
for drive in sda sdb sdc sdd
do
    echo "Dumping data for drive ${drive}"
    fdisk -l
    smartctl -a /dev/${drive}
    dmesg -T | tail -n50
done
echo "Ended device data dump"

将其放入每分钟运行一次的 cron 中，并将输出写入文件

crontab -e

Crontab 行添加：

* * * * * /usr/local/bin/logcommand.sh >> /var/log/disk-problem.log

手动检查文件中的内容。您应该能够看到 sdd 的智能数据，如型号、品牌、序列号，并将其与其他驱动器进行比较。如果其中一个断开连接，则会出现匹配，如果没有，您仍然应该能够获取有关该神秘 sdd 驱动器及其可能的信息。

另外，检查你的 dmesg 是否写入 /var/log 中的某个文件。dmesg 应该打印设备断开连接和检测信息。

附言：此外，由于当您发现您的机器挂起时，它可能是您的根设备，它会给您带来问题，因为它拥有基本系统，如果没有它，机器就无法运行。

Answer

可能是您的某个驱动器断开连接后重新连接，但被检测为新设备。根据我使用 Linux 服务器的经验，如果旧设备未正确断开连接且内核仍保留其字母，则有时会发生这种情况，当它重新连接时会为其分配一个新字母。可能是您的某个驱动器出现故障或电缆未固定。这实际上取决于控制器及其处理设备的方式。

由于您说您发现机器已经挂起，而您无法真正查看它发生了什么，我建议您编写一个小的 bash 脚本，不断提取有关所有驱动器的信息并将其写入文件，最好是写入您确定可以正常工作的驱动器之一，否则如果您尝试在故障驱动器上写入，则可能无法写入。脚本可能类似于：

#!/bin/bash 


date
echo "Starting device data dump" 
for drive in sda sdb sdc sdd
do
    echo "Dumping data for drive ${drive}"
    fdisk -l
    smartctl -a /dev/${drive}
    dmesg -T | tail -n50
done
echo "Ended device data dump"

将其放入每分钟运行一次的 cron 中，并将输出写入文件

crontab -e

Crontab 行添加：

* * * * * /usr/local/bin/logcommand.sh >> /var/log/disk-problem.log

手动检查文件中的内容。您应该能够看到 sdd 的智能数据，如型号、品牌、序列号，并将其与其他驱动器进行比较。如果其中一个断开连接，则会出现匹配，如果没有，您仍然应该能够获取有关该神秘 sdd 驱动器及其可能的信息。

另外，检查你的 dmesg 是否写入 /var/log 中的某个文件。dmesg 应该打印设备断开连接和检测信息。

附言：此外，由于当您发现您的机器挂起时，它可能是您的根设备，它会给您带来问题，因为它拥有基本系统，如果没有它，机器就无法运行。

Question 2

我不知道这是否有帮助，但我也有类似的情况。该系统是运行 Linux Mint 18.3 (XFCE) 的 Intel NUC，配备 8GB RAM 和 M2 SSD，因此与 OP 非常相似。

我的问题只在运行 Thunderbird 时出现。我将所有 Thunderbird 数据导向另一台用作服务器的 Linux Mint 计算机。小型 Thunderbird 帐户可以正常工作，但较大的帐户会导致系统变得不稳定，Thunderbird 根本无法运行。

Linux Mint 18.3 (XFCE) 附带 Linux 内核 4.10.0-38，在我的系统上运行良好 - Thunderbird 在其他系统上运行良好。但是，如果我使用内置的 Mint 升级包将 Linux 内核升级到 4.10.0-42，Thunderbird 会导致上述问题。

我必须强调，这个问题（使用较新的内核 - 4.10.0-42）仅发生在我的 NUC 电脑上 - 其他系统在升级内核后运行良好。

我的临时解决方案是坚持使用 4.10.0-38 内核，并在使用之前对任何升级进行全面测试。

Answer

我不知道这是否有帮助，但我也有类似的情况。该系统是运行 Linux Mint 18.3 (XFCE) 的 Intel NUC，配备 8GB RAM 和 M2 SSD，因此与 OP 非常相似。

我的问题只在运行 Thunderbird 时出现。我将所有 Thunderbird 数据导向另一台用作服务器的 Linux Mint 计算机。小型 Thunderbird 帐户可以正常工作，但较大的帐户会导致系统变得不稳定，Thunderbird 根本无法运行。

Linux Mint 18.3 (XFCE) 附带 Linux 内核 4.10.0-38，在我的系统上运行良好 - Thunderbird 在其他系统上运行良好。但是，如果我使用内置的 Mint 升级包将 Linux 内核升级到 4.10.0-42，Thunderbird 会导致上述问题。

我必须强调，这个问题（使用较新的内核 - 4.10.0-42）仅发生在我的 NUC 电脑上 - 其他系统在升级内核后运行良好。

我的临时解决方案是坚持使用 4.10.0-38 内核，并在使用之前对任何升级进行全面测试。

我的 Linux 系统偶尔会莫名其妙地挂起。我该怎么办？

附加信息

我的机器

答案1

答案2

相关内容