为什么重新启动大型机尤其糟糕?

为什么重新启动大型机尤其糟糕?

在我的整个职业生涯中,我经常听到这样的话,几乎每个我合作过的大型机操作员/管理员都会这么说,但到目前为止,我从未真正质疑过它,也没有理由关心它。永远不要重新启动大型机,因为这是极其可怕的异端邪说,它会带来各种风险和问题,而且每次有人重新启动大型机时,IBM 都会害死一只小狗。(或者类似的事情,无论如何。)

好吧,最近,我被迫陷入一种情况,我有理由关心这个问题,但我越想越觉得这毫无意义。大型机硬件的设计具有弹性,这些硬件上的操作系统几乎是最稳定的,而且我很确定 IBM 实际上并没有大量的小狗库存,每次 iSeries 重新启动时都要杀死它们。

当然,我知道服务器重启通常都是不好的做法,或者是不得已的选择,或者只有当值班人员有安排好时间时才应该做的事情,但我目前正在想尽各种办法避免重启 iSeries,因为...嗯,“只是因为”,看起来是这样。

考虑到这一点,有大型机经验的人能否解释一下重新启动大型机与重新启动 *nix 或 Windows 服务器相比特别糟糕的技术原因?

答案1

在重启频率不高的情况下,重启往往会出现各种在正常运行期间不会出现的不幸的软件错误。由于这些错误不经常出现,它们不会被注意到,因此不会被修复。这使得重启时间成为一件非常可怕的事情。

另一个问题是,大型机往往会执行很多不同的任务,因此重新启动大型机可能会让很多不同的系统暂时停止运行。根据主机上的内容,重新启动时,整个业务可能会停止运行 10 分钟。

答案2

我不知道这是否广泛适用,但在我工作过的 2 个拥有大型机和程序员的地方,重启是被禁止的,因为重启后需要大量手动工作才能使应用程序启动并运行。例如修复与其他系统的通信问题、处理磁盘上不一致的数据等。

在我看来(我不是大型机程序员),这些都是软件编写不当的迹象。我的意思是,拜托!磁盘上的数据不一致!?我又不是拔了你的电源线。我通知你彻底关机!

YMMV,但这是我的经历。

答案3

嗯,两件物品。

首先,请记住大型机非常复杂,并非所有软件都能在重新启动时停止运行 - 您可能会遇到很多问题,因为进程在某事中途中断。手动清理时间。大型机正在积极开发以避免这些问题 - 使用事务内存更新(正确编程时)和允许热交换处理器的进程等;)

其次,当你谈论重启时,一定要清楚自己在说什么。几乎每台大型机都运行 VMS 或类似的东西。VMS 是“最初的”虚拟机管理程序 - 就像 steroits 上的 VmWare,而且比 VMS 早 50 年 ;) 可以这么说。

重启是什么意思?重启主机,还是重启虚拟机中的操作系统实例?;)

我认为重新启动大型机几乎没有必要,主要是因为(a)无论如何你在虚拟机中拥有一切,并且(b)即使大多数硬件故障也不需要核心重新启动。

相关内容