系统管理标准

系统管理标准

我被赋予了管理一个由 4 名系统管理员组成的团队的责任。他们管理着 70 多台服务器。他们还没有书面流程/程序/实践。我对系统管理不太了解。是否有一个标准可以让我们遵循来标准化我们的工作或选择最佳实践?

答案1

我赞同其他人关于不要贸然行事和制定法律的建议。你说团队目前正在管理 70 多台服务器,所以我的第一个问题是:他们做得怎么样? 是否出现大量计划外停机、工作日停电、在发生故障前不断忙于维修?还是从服务交付的角度来看,他们做得还不错,只有偶尔发生的不可预见的灾难(我们所有人都会遇到这种灾难)会破坏和平?

如果是后者,那么你就有了一个优秀的团队,他们似乎知道自己在做什么,而且不去修复没有损坏的东西是让你的团队不失望的重要部分。

如果是前者,您可能仍然拥有一支优秀的团队;优秀的团队可能会因为缺乏企业的支持和参与(没有新设备的预算、没有就升级而不停机所需的午夜工作补偿达成协议、没有就 SLA 达成明确协议)或内部摩擦或许多其他非技术原因而陷入困境。

如果是前者,当然,你的团队可能不够强大。

正确的应对方法各不相同疯狂地在这三种场景中,也会受到相关人物性格的影响。

如果你有一个优秀的团队,工作出色,那么就让他们领导你。他们所做的事情是正确的,但你需要了解他们做了什么,以及如何做。如果你问,他们会告诉你,如果你礼貌地问,他们可能会以最有用的方式告诉你,把一切都写下来。年度审查和商定的目标是在系统管理员的工作生活中插入更多文档的好方法。从本质上讲,他们现在所做的事情接近最佳实践,所以试着让他们以一种互惠互利的方式记录下来,而不是强加任何东西给他们。

如果你有一个工作表现不佳的优秀团队,他们可能知道需要改变什么才能成为一个工作出色的优秀团队。倾听他们的意见,并想办法将他们的需求转化为合理的要求,然后再反馈给业务。如果你愿意倾听他们的意见,那么作为技术世界和商业世界之间的桥梁,你可以创造很多价值两个都并说“不”两个都双方各占适当比例。

如果你的团队工作不力,那么你就得付出代价了。识别和记录问题所在对于惩戒员工非常重要,如果有必要,还可以更换员工,而不会让企业承担责任。识别容易实现的目标(可以轻易推动其顺利进行的事情)对于快速获得团队激励和企业信誉非常重要,而确定问题所在有助于表明已经取得了一些快速的改进。

我知道我有些跑题了,但我真诚地相信最佳实践和标准化是为了满足业务和人员完成工作的需求而存在的,而不是孤立地存在于真空中的文档卓越之巅,所以我的回答反映了我相互联系的方法。如果太长了,我很抱歉!

答案2

考虑从 ITIL 开始:http://en.wikipedia.org/wiki/Information_Technology_Infrastructure_Library

ITIL 详细描述了许多重要的 IT 实践,并提供了任何 IT 组织都可以根据其需求进行定制的综合清单、任务和程序。

不要指望读完一本 ITIL 书就能了解一切,但它是个不错的起点。读完 ITIL 后再告诉系统管理员“新法律”可能会让一些系统管理员不高兴。

我建议让他们坐下来,与他们讨论如何最好地改进文档,以及如何涵盖时间跟踪等。

答案3

你可能想从系统与网络管理实践,第二版作者:Thomas A. Limoncelli、Christina J. Hogan 和 Strata R. Chalup。书中概述了一些非常好的最佳实践,可以帮助您和您的团队走上正确的道路。这本书非常实用,虽然篇幅很长,但读起来很容易。

ITIL 是值得牢记的好事,但对于刚接触 ITIL 的人来说,他们很容易因为试图严格执行其描述而受阻。使用您需要的内容,记住以后可能需要的内容,但不要让它妨碍您完成客户期望的工作。

答案4

作为系统管理员,我建议您让您的团队专注于:

  1. 记录 - 不仅有系统描述,还有变更日志、所有自定义工具的记录等等
  2. 服务器和服务监控
  3. 自动化部署/配置

这三个方面应该会让你的团队富有成效,你的团队成员可替换。

相关内容