固件更新时很少受到关注。眼不见,心不烦。
许多设备:RAID 控制器、NIC、芯片组,甚至硬盘,都可以通过更新获得一些好处。更好的功能、安全性/错误修复等。
大多数 SA 都说:“一旦出现故障,就更新固件。”但这可能会导致日后出现问题;有几次,当我联系戴尔咨询硬盘故障问题时,他们问我硬盘固件是否是最新的。我的所有服务器都使用某种类型的 RAID 配置。如果我的单个驱动器已经出现故障,我是否应该考虑尝试升级其余驱动器或 RAID 控制器上的固件?我会说不。但戴尔似乎有不同的看法。
- 系统固件的实际更新时间表是怎样的?
- 您有什么最佳实践可以分享吗?
(我知道戴尔有一个很好的实用程序,叫做服务器更新实用程序,它会检查任何戴尔服务器上的所有新固件。)
答案1
我在两个关键实例中更新固件。
- 当准备启动服务器时。
- 当我刚拿到服务器时,我会检查 HP 网站,了解其最新“固件更新 CD”的日期。如果更新得足够新,我会在服务器投入生产之前先运行该更新。
- 当我重新利用服务器时。通常,这台服务器已有 2-5 年历史,并且可能在这段时间内没有进行过固件更新。由于我无论如何都要重新格式化它,因此我将更新服务器上的所有各种固件。
- 当确定有供应商时就需要这样做。
- 有时会发现重大的稳定性问题,例如在错误类型的故障后无法重建 RAID5 阵列,或者 NIC 上的 TCP 卸载引擎存在重大性能错误。
- 有时打电话寻求支持时,支持技术人员会要求我更新固件。然后我会这样做。
还有第三个情况,上面我没有列出,因为它还没有发生:
- 当将较新的组件放入较旧的服务器时。有时系统 BIOS 需要更新才能处理它。
答案2
我们使用 HP SIM(System's Insight Manager)推出固件,我们按平台进行 - 首先测试,然后开发,然后集成,然后参考,最后生产 - 通常每个平台大约一周左右,所以我们有 5/6 周的发布到生产窗口。似乎有效,但我们从不做的一件事是同时推出固件和其他更新,如驱动程序/代码等 - 避免了很多指责。
答案3
我可能在这里违背常理,但如果它没坏就不要去修复它。如果它不是安全问题,那么我就不管它了。
我从未遇到过戴尔因这个原因拒绝提供服务的情况。
也许您可以每月安排一次实用程序,然后通过其他重启来更新它们?
答案4
我通常会在调试任何新的基础设施设备时更新固件。工作站和打印机只有在出现特定问题(例如需要修复错误或安全问题)时才会更新。对于服务器来说,这一点不太重要,因为在大多数情况下,固件代码要么在启动过程之外不执行,要么非常简单,几乎不会出错。
我在服务器上升级 RAID 固件时有过不好的经历,因为许多制造商不保证如果固件版本发生变化,当前的 RAID 配置将可行,阵列中的各个磁盘也是如此。
我倾向于在大多数情况下采用“如果它没坏,就不要修理它”的政策。值得检查的是,是否有可能从错误的固件升级中恢复(即 HP 服务器中的冗余 ROM,或者您是否有 EEPROM 闪存器并愿意将其用作可移动芯片)。