我在 IBM Cloud 上运行 Windows 2016 Server。今天服务器崩溃了,变得没有响应,网站和 Microsoft SQL 数据库服务器实例也停止响应。
通常情况下 CPU 使用率和 RAM 使用率都很好。我附上了上周的截图。
现在,在我们必须重启服务器之前,任务管理器显示内存使用率已达到 99%。但是,显然还有其他未显示的内容占用了所有内存。
这次宕机发生时,我作为唯一的计算机工程师正在睡觉。我赶到时服务器已经重启,然后我才收到停机 30 分钟的报告。
我想弄清楚是什么开始占用所有内存。我搜索了我能找到的该时间段内的所有日志,但找不到任何有用的信息。有什么技巧可以找出罪魁祸首吗?有没有办法记录并记录正在运行的进程以及它们使用了多少内存?(这样我就可以来看看哪个进程使用了所有的内存)
崩溃时的任务管理器:
7天的CPU使用率:
7天的内存使用情况:
任务管理器正常使用: