我有一个 2 节点 IIS 集群,在 Windows Server 2019 下使用 Microsoft 网络负载平衡托管多个网站/应用程序池。该集群运行了一年,没有出现问题。但是,从几个月前开始,大约每月一次,两个 Web 服务器中的一个将停止响应所有 http/https 请求。NLB 不会检测到服务器已关闭,因此在此期间,一半的网站请求都会失败。发生这种情况时,IIS 管理器会锁定,命令行中的 iisreset 会响应“重新启动尝试失败”。在此期间,HTTP 错误日志中充满了 503 响应代码/QueueFill 消息。Windows 系统/应用程序日志中没有指示问题的特定事件。服务器的性能根本不是问题。重新启动有问题的服务器可以解决该问题。
我该怎么做才能找到该问题的原因?