我们经常需要弄清楚这样的问题:
- 如果我们关闭 ,哪些服务会影响
server x
? - 什麼時間
license x
到期? - 哪些 KVM 客户机正在运行
host x
? - 我们的 VMWare 许可证可以支持吗
feature x
?
你们如何处理这些问题?是否有工具或软件可以帮助准确记录所有或大部分这些物品的库存?
答案1
我可以告诉你什么是行不通的:拥有手动编辑的文档、电子表格、网页或 wiki。
我还没有看到一个组织严格到手动保持其技术文档 100% 准确和最新。不准确的文档不仅令人讨厌;而且非常危险。如果有人忘记记录正在service a
运行的会发生什么server x
?如果您信任文档,您最终会遇到意外停机service a
。
解决方案的第一部分是使用监控平台(如 Xymon、Nagios 或 Zabbix,还有很多其他平台)自动化该过程。可以使用自定义脚本扩展这些平台,以回答有关软件和硬件的大多数问题。监控平台将确保此自动文档保持最新。
解决方案的第二部分是建立一种机制,当覆盖不完整时会向您发出警告。例如,我使用自定义脚本,该脚本列出系统上运行的所有进程,过滤掉受监控或可忽略的进程,并提醒我任何意外的进程 - 这告诉我是时候将这些新进程添加到监控平台了。另一个示例是将您的 Cisco 端口状态与 CDP 信息进行交叉引用,以确保您已覆盖所有服务器。
这种方法的最大好处是,您可以免费进行文档记录并获得警报和趋势分析。
答案2
我认为思维导图是个不错的主意。我正在使用 DrupalGraphMind模块。