如何检查系统健康状况?

如何检查系统健康状况?

我想要一份系统健康状况报告,以便了解所有硬件组件(CPU、内存、磁盘……)是否按预期运行。如果报告仅列出发现的问题(如果有),则阅读起来会更容易。是否有系统工具可以做到这一点?

相关说明:

  • 我知道磁盘实用程序可以报​​告磁盘的 SMART 结果。我希望所有其他组件也能有类似的结果。
  • 原始诊断工具和基准不适合。诊断工具列出了组件的详细信息,但没有列出它们的健康状况。基准测试有时只会突出显示健康问题。我只对直接的健康报告感兴趣。
  • 我知道在 Windows 中有一个执行此功能(报告硬件组件是否出现故障)的等效工具,但我忘记了名称:P 我基本上想要一个与此等效的工具。

答案1

电子设备通常 100% 或 0% 工作。硬盘等机械设备确实有即将发生故障的指标,如聪明的您已经了解的报告。

风扇

风扇有即将发生故障的指示器,但这是基于您的听觉和聆听诸如振荡速度、尖叫轴承等指示器。

中央处理器

风扇性能下降的另一个潜在指标是 CPU 热量水平。在笔记本电脑上,这意味着风扇排气口堵塞或 RPM 太低。这也可能意味着 CPU/主板需要用压缩空气清洁灰尘(不要使用含有水分的呼吸)。这也可能意味着您的 CPU 散热器需要重新安装新的导热膏。

内存

如果您的机器锁定并显示内存错误,您可以按照以下说明测试您的 RAM:如何通过 linux 检查 RAM 中的错误?

如果 RAM 检查器发现坏内存块,您可以按照以下说明将其列入黑名单:有没有办法限制内核的内存管理器仅使用 75% 的内存?

NVMe PCIe M.2 Gen 3.0 x 4(或 2)SSD

如果你有固态硬盘,它们的寿命以万亿次写入来衡量。你的聪明的实用程序已经测量了 SSD 寿命,但不包括 NVMe SSD。为此,您需要nvme-cli。要安装它,请使用:

sudo apt install nvme-cli

接下来收集 SSD 提供的信息:

$ sudo nvme smart-log /dev/nvme0
Smart Log for NVME device:nvme0 namespace-id:ffffffff
critical_warning                    : 0
temperature                         : 40 C
available_spare                     : 100%
available_spare_threshold           : 10%
percentage_used                     : 0%
data_units_read                     : 12,539,332
data_units_written                  : 10,623,582
host_read_commands                  : 281,194,884
host_write_commands                 : 96,528,713
controller_busy_time                : 672
power_cycles                        : 1,677
power_on_hours                      : 687
unsafe_shutdowns                    : 105
media_errors                        : 0
num_err_log_entries                 : 279
Warning Temperature Time            : 0
Critical Composite Temperature Time : 0
Temperature Sensor 1                : 40 C
Temperature Sensor 2                : 51 C
Temperature Sensor 3                : 0 C
Temperature Sensor 4                : 0 C
Temperature Sensor 5                : 0 C
Temperature Sensor 6                : 0 C
Temperature Sensor 7                : 0 C
Temperature Sensor 8                : 0 C

最重要的字段是Percentage used显示为 0% 的字段。这不是磁盘使用率百分比,而是生活使用百分比。该驱动器于 2017 年 10 月购买,到0%2018 年 12 月仍处于Percentage used使用状态。2020 年 10 月达到 1%。按照这个速度,NVMe SSD 的使用寿命将达到 300 年。当然,在那之前它就会过时了……

桌面上的系统监视器conky

许多人喜欢在桌面的某个部分显示系统状态(和健康状况)。我喜欢让 Conky 在主显示器的右侧 20% 处运行:

Conky 全部.gif

笔记:单CPU占用97%是由于屏幕录像机本身的问题。

要了解有关conkyCPU 使用率的更多信息,请参阅:如何(同时)对 CPU 和 RAM 进行压力测试?

相关内容