我感兴趣的是管理员在日常 Unix/Linux 环境中可能面临的最常见事件(即服务中断、文件系统已满、CPU 峰值、内存已满)管理。有研究指出它们是什么吗?是否有任何公开的数据集列出了大型组织在给定时期内面临的事件?
答案1
我认为这样的统计数据都不可靠。问题通常是人们如何设计和开发服务的原因。一个典型的问题可能是日志文件轮换和一般内务管理。在此之后,可能会出现以下类型的问题:日志文件未正确关闭,并且由于应用程序写入已删除的文件而导致磁盘填满,但打开的 FD 继续消耗。
这完全取决于各个应用程序所有者如何编写程序。
您最好查看组织中正在使用哪些应用程序,并查看用户邮件列表以了解常见问题是什么。您可以通过查看您感兴趣的发行版中的默认应用程序来更进一步。