我如何确定是什么导致我的服务器挂起?

我如何确定是什么导致我的服务器挂起?

我们有一个名为 Universe 的数据库,它在 Windows 2003 服务器上运行。一天中的大部分时间,一切都运行良好,我们没有遇到任何问题。实际上,它大部分时间都运行良好。我们过去曾遇到过一些问题,服务器没有响应,因此我们安装了一个名为 Process Lasso 的应用程序来帮助管理 CPU 并保持运行。

这个软件帮了我们很多忙,然而,最近几周我们又遇到了问题。我们使用 telnet 连接到我们的数据库,大约 5 分钟后它就会无响应。我们可以远程访问服务器,但当我们进入服务器时,问题已经不复存在,一切都恢复正常。

另一个有趣的事情是,昨天早上我远程访问了服务器。我打开了 Windows 资源管理器,复制并重命名了一个相当大的目录。当我这样做时,系统变得没有响应,我无法通过 telnet 访问它。这是正常的吗?这种情况甚至发生在我们的测试机器上,因为我能够在那里重现这个问题。这让我想知道后台发生了什么导致这个问题。

您将如何连接它来确定发生了什么?请记住,我只是一名程序员,但在弄清楚这件事上有点困难。

答案1

从微软网站获取 sysinternals 套件(免费)。它有可以监控文件访问、注册表访问和进程活动的工具,这些工具可能会提供一些线索,说明正在发生什么。

我见过服务器上 Explorer 在某些磁盘活动上“锁定”的情况。我不知道这是 Explorer 的问题还是文件系统或磁盘子系统的问题,但我见过这种情况发生。在服务器上,前 20 秒之后,尤其是当您处于远程状态时,想到您即将收到“服务器退出”呼叫,您会感到非常害怕……

答案2

答案3

按照 Nunya 的建议检查事件日志。除此之外,还需要对系统进行大量强化,查看系统并关闭不需要运行的服务。

例如,几年前,我们的一个客户遇到了莫名其妙的周期性减速,我们最终发现,这是由于他们的 IT 部门将服务器配置为备份 DNS 服务器所致。每当服务器同步其 DNS 数据时,它就会变得非常缓慢。

答案4

上面的答案真的很棒!另外要注意的是短信或类似的东西将东西推到盒子上,如果是的话,哪些资源被占用了。

相关内容