自从我上次使用 HP-UX 服务器以来已经有一段时间了。因此,我的记忆不太新鲜,想就此请教一下大众的智慧。
我手头的任务是为 HP-UX 服务器制定一个可测量的监控标准,特定于该操作系统(版本 11.X,其中 X 可以是 0、11、11i、23 或 31)并特定于 HP 硬件。一般监控规则是默认设置的,例如CPU利用率高于95%或磁盘利用率高于特定阈值,或者有人尝试登录某些未经授权的帐户失败。这些条件和类似条件对于监视任何 UNIX 风格来说都是有效且微不足道的。我对那些不感兴趣。我对那些可能会在 HP-UX 中出现故障并且不会被注意到的东西感兴趣,除非有人专门寻找它们。一个例子:
if [ $(ioscan -fn | grep NO_HW | wc -l) -gt 0 ]
then
echo "One or more device(s) went missing"
fi
我知道,这是一个非常简单的问题。简单是我能记住的原因。此外,由于ioscan
在任何其他 UNIX 版本上都不可用,因此它是 HP-UX 特定的。
一定还有其他一些事情是您只能在 HP-UX 上监视的,我想编制一个此类标准的列表。例如,任何需要一直运行的关键但不明显的流程都会浮现在脑海中。我还记得一些你可以输入stm
或cstm
命令的神奇字符串,以查询你的 CPU、内存或其他硬件。
如果您有如此深奥的命令并且愿意分享,我们将不胜感激。