停机调度——可以自动化吗?

停机调度——可以自动化吗?

当我的工作场所的服务器需要安排停机时间时,我们遵循大致如下的流程:

  1. 提出针对特定箱子进行工作的时间
  2. 查找特定框的利益相关者列表
  3. 通过电子邮件寻求利益相关者(服务所有者/管理层等)的批准
  4. 如果有必要的话,将变更纳入建议的时间,重复步骤 2,直到..
  5. 现在每个人都对时间感到满意,通过电子邮件发送时间通知,询问
  6. 关心箱子何时下架的员工会手动将其添加到日历中
    1. 一些利益相关者
    2. 工作人员
  7. 做实际工作

有没有一个 OSS 项目可以用来自动化这个过程?到目前为止,我的谷歌搜索毫无结果。我们需要自己构建一些东西吗?还有其他人对这样的东西感兴趣吗?

答案1

我没有软件可以给你答案,但这种情况是我们在我的工作地点定期安排维护窗口的原因之一。我们有一个月度窗口,每个人都知道,不需要任何许可。在每个窗口之前,我们都会弄清楚在那段时间内我们到底要做什么,然后向所有人发送通知,确切说明哪些盒子/服务将不可用。这个解决方案也不完美,但肯定比每次都要协商要好。

答案2

和 icky2000 一样,我安排了维护时段。我的维护时段是每周日凌晨 3 点到 4 点之间。这个时段是我的,任何在那个时段使用我的网络的人,如果他们愚蠢到在早上那个时段工作,那么对他们造成的任何不便,我都不会道歉。

只要有可能,就会利用维护期,大多数情况下用于自动执行任务,例如安装补丁、重新启动等。我无法(或不会)在这段时间内完成的大型工作通常会在周日早上(上午 9 点之前)完成,因为那时系统最不可能被使用。值得注意的是,我在一家小公司工作,这里的安排比大公司灵活一些。

多年来,对我来说,维护窗口的真正关键在于尽可能避免维护需求。只要我能管理,我就会完成小任务,无论是在工作时间、上班前的清晨还是深夜。大型任务(例如设置新服务器)通常通过离线设置所有任务,然后在正常工作时间内插入新机器来管理,这样对用户的影响很小甚至没有影响。显然,每个维护任务都必须单独考虑。

答案3

我不知道它是否存在于开源中,但您搜索的是与 CMDB 关联的 HP 的 Service Manager 或 IBM 的 Remedy 等软件。

服务管理软件负责审批流程,CMDB 维护哪个系统上哪个服务的利益相关者的信息。

这不是一项容易完成的任务,所以如果你的公司规模较小或者你没有时间,那么最好的解决方案(如前两篇文章所述)就是有一个固定的维护窗口。

问候

相关内容