如何监视 HP-UX 服务器的操作系统或硬件特定问题

如何监视 HP-UX 服务器的操作系统或硬件特定问题

自从我上次使用 HP-UX 服务器以来已经有一段时间了。因此,我的记忆不太新鲜,想就此请教一下大众的智慧。

我手头的任务是为 HP-UX 服务器制定一个可测量的监控标准,特定于该操作系统(版本 11.X,其中 X 可以是 0、11、11i、23 或 31)并特定于 HP 硬件。一般监控规则是默认设置的,例如CPU利用率高于95%或磁盘利用率高于特定阈值,或者有人尝试登录某些未经授权的帐户失败。这些条件和类似条件对于监视任何 UNIX 风格来说都是有效且微不足道的。我对那些不感兴趣。我对那些可能会在 HP-UX 中出现故障并且不会被注意到的东西感兴趣,除非有人专门寻找它们。一个例子:

if [ $(ioscan -fn | grep NO_HW | wc -l) -gt 0 ]
then
  echo "One or more device(s) went missing"
fi

我知道,这是一个非常简单的问题。简单是我能记住的原因。此外,由于ioscan在任何其他 UNIX 版本上都不可用,因此它是 HP-UX 特定的。

一定还有其他一些事情是您只能在 HP-UX 上监视的,我想编制一个此类标准的列表。例如,任何需要一直运行的关键但不明显的流程都会浮现在脑海中。我还记得一些你可以输入stmcstm命令的神奇字符串,以查询你的 CPU、内存或其他硬件。

如果您有如此深奥的命令并且愿意分享,我们将不胜感激。

相关内容