在我们的 NOC 中,我们保持对所有物理安全区域的态势感知(反应性视频源)、有关数据中心物理特征的一些基本信息、天气和国家新闻源。您是否还推荐 NOC 监视器的其他功能,或者这是否已经足够好了。
答案1
这是一个相当广泛的问题,但我假设我们正在避免服务或逻辑级别的监控(即 SSH 监听、网站正常响应、磁盘空间、CPU 使用率等)。
您的 NOC 应该同时进行持续的不干预监控以及定期的手动/目视监控。
持续监控:
- 来自数据中心多个传感器的环境温度/湿度
- 数据中心所有电路的耗电量
- 空调机组自我报告的负载/健康状况
- 数据中心内部、所有数据中心入口以及 NOC 区域入口的视频源
- UPS 电池状态
- 记录数据中心的所有入口/出口(无论是刷卡还是手动登录)
- 交换机端口/路由器接口状态事件(启动/关闭/速度变化)
定期演练:
- 机架已关闭并锁定
- 任何声音或视觉硬件警报(灯光、音调、状态 LCD)
- 地砖已铺好且状况良好
- 数据中心入口已关闭并上锁
- 相机不受干扰
- 数据中心内或周围没有意外访客
- 灯坏了、窗户破了、门坏了,任何使物理安全更容易被破坏的因素
另外,为什么要费心提供全国新闻提要?除非您的数据中心遍布全国,否则收听本地新闻台更有意义。不过,这在整体上的价值值得怀疑,因为它的噪声:信号比非常高。如果有的话,只需订阅相关新闻媒体的 RSS 提要即可。
最后,这可能不是您想要的,但我发现在我的网络之外进行测试非常有价值。使用小数据包和大数据包测试几个知名网络(Google、Yahoo、Microsoft 等)的高延迟或数据包丢失情况、检查常见网站是否有正确的返回代码以及测量往返几个流行的免费邮件网站(Yahoo、Hotmail、Gmail)的电子邮件往返延迟,这些都让我在用户开始打电话之前就发现了几个微妙的问题。
答案2
我一直想把 Securitywizardry.com 提供的雷达安装在 NOC/SOC 的大型等离子上,因为它很酷:http://www.securitywizardry.com/radar.htm
它包括安全新闻、“健康”水平、新出现的威胁以及有关工具更新的信息。
答案3
我的想法是贯穿事物的物质方面。
经常走过去,如果您在现场并且是 24/7 办公场所,那么让两个人在轮班开始时分别走过去。如果他们一起走过去,他们只会聊天,而看不到他们应该看到的东西。
- 如果不在现场,请尝试安排员工定期走访或雇用当地承包商来进行。
- 我想说至少每周一次,但是每天一次更好。
- 如果管道内有任何液体管道(暖通空调冷却器管线、生活用水管线、楼上浴室的污水管线等),则应更频繁地进行检查
- 寻找不合适的地方
- 滴水的管道可以被人眼发现,而不是被电子传感器发现
- 检查地板下面
- 触摸暖通空调通风口,确保它们处于打开状态
- 听听 UPS 的声音。如果它们的嗡嗡声比正常情况下大,你可能需要检查一下
- 任何变压器也是如此
- 闻一下,里面有很多电子设备
- 保持卫生
如果你有单独的发电机/杂物间,也请检查一下
- 确保燃油管路没有泄漏
- 保持卫生
- 噪音和气味
- 如果发电机正在进行自动测试,请在测试后进行检查,确保没有发生泄漏。
每年对电气面板进行几次热扫描是个不错的主意。这将发现即将发生故障的设备,因为它们看起来更热。
每一次失败都是从小事开始的,如果你在小事上发现它,你就可以按计划解决它
答案4
内部或外部事件的 RSS 源可能会很有用。我们使用内部博客进行变更控制,并将输出通过 RSS 阅读器屏幕保护程序传输到 Mac。