检测挂起的 OpenStack/Linux 服务的其他方法？

Question 1

使用 Zabbix 或 Nagios 等监控解决方案，为服务编写脚本/检查，包括监控进程存在性、进程 CPU 使用率、进程内存使用率、API 响应等

Answer

使用 Zabbix 或 Nagios 等监控解决方案，为服务编写脚本/检查，包括监控进程存在性、进程 CPU 使用率、进程内存使用率、API 响应等

Question 2

您可以编写一个脚本（cron 作业？）来检查要监控的 OpenStack 服务的日志的时间戳。我认为大多数服务都会执行某种审计并记录下来。任何操作也都应该生成日志。这样，如果日志一段时间后没有更新，您可以尝试重新启动服务。

正如您提到的，确定它们被挂起的原因至关重要。

Answer

您可以编写一个脚本（cron 作业？）来检查要监控的 OpenStack 服务的日志的时间戳。我认为大多数服务都会执行某种审计并记录下来。任何操作也都应该生成日志。这样，如果日志一段时间后没有更新，您可以尝试重新启动服务。

正如您提到的，确定它们被挂起的原因至关重要。

相关内容