我正在运行 Windows Server 2003,我怀疑它的 HDD 可能已经老化了。
最近我的服务器出现了连接问题,互联网有时会突然断线。有时当我使用 Windows 的远程桌面连接连接到服务器时,服务器会断线。
机器重启后总会重新获得互联网连接。我不得不编写一个应用程序,每 30 分钟检查一次是否可以找到 Google,如果找不到,则重新启动网络适配器,等待 10 分钟,重新启用适配器,如果之后仍找不到 Google,则自动重启机器,从而再次获得互联网连接。
现在,这对于服务器来说是一件非常糟糕的事情。这可能是因为硬盘开始失效了吗?由于应用程序重新启动了机器,所以整个操作系统并没有冻结,只是失去了连接。我知道是我的应用程序重新启动了,因为它在重新启动之前会记录日志。
有人能给我提供任何建议,帮助我调查互联网突然消失的原因吗?
有没有简单的方法可以检查 Windows Server 2003 中的 HDD 健康状况?
答案1
请先备份 正如杰夫所建议的那样。
首先要做的事情
您是否尝试过更新您的 BIOS 和驱动程序,尤其是芯片组/网络/raid?
做一些简单的事情,可能会解决问题甚至更多。:-)
您检查过事件日志吗?
如果它确实显示了某个时刻,你可以稍后跳过我建议的视频录制。仍然对你的网关进行 ping,这样检测就会尽快完成,而不是几秒钟后。除此之外,它甚至可能告诉你原因并彻底解决问题。
您是否尝试过生成 I/O 来查看是否会导致丢失?
尝试使用磁盘基准测试软件,尤其是列出稳定性测试的软件,以查看它是否会断开您的连接。尝试使用以下方法进行错误扫描:高清调谐例如,它应该触发磁盘上的任何坏部分......
故障排除简介
首先,您需要确保问题出在服务器上,而不是路由器放弃租约。此外,当问题频繁发生以至于您可以实时监控时,您可能希望查看当时发生的情况。您可以通过实时监控或记录并事后进行故障排除来做到这一点。
如果没有,最好的办法是设置视频录制来了解事件发生的时刻,以便回顾。
对于日志记录工具,长时间(30 分钟)的记录将填满磁盘或内存。因此,如果您要让它长时间无人值守运行,那么要获得足够的细节可能并不可行...
监控
乒?乒!乒?乒?
开始 ping -t GATEWAY && ping -t DOMAIN
将 GATEWAY 替换为您的路由器 IP,将 DOMAIN 替换为互联网域名,例如 Google.com。
这将持续 ping 两个地址,您将能够立即看到连接何时断开,从而让您看到当时究竟发生了什么。
我的流程正在做什么?
您可以使用进程探索器到:
- 检查当时处于活动状态的进程,并尽可能多地包含有用的详细信息列。
- 检查驱动程序是否因中断、DPC 或系统进程中的 100% CPU 峰值而出现异常。
- 检查正在进行的 I/O 使用情况,显示磁盘和网络。
- 检查内存和句柄泄漏。
- 不记录任何内容,除了使用图表之外。
正在发生什么 I/O?
您可以使用进程监控到:
- 记录进程、线程和 I/O(磁盘 + 网络)活动。
- 过滤掉那些可能不会导致数据使用量减少的因素,确保删除事件。
- 有有用的表格和图表供您参考,但可能没有帮助,因为您的问题是一个特定的时间。
还有什么事情发生?
您可以使用性能性能Windows SDK 中的 Windows 性能工具包也可以执行此操作。
请注意,这将使用内存中的循环缓冲区来防止内存已满,如果您希望磁盘填满,则可以将命令中的配置文件替换为perf!GeneralProfiles.InSequentialFile
。需要注意的是,您可能不想在无人值守的情况下运行此操作,因为您的磁盘将很快填满,而将其配置为较少的细节可能会忽略原因...
可以按如下方式排除故障:
- 从以下位置下载安装程序Windows 性能分析工具适合您的 Windows 版本。
- 在您的系统上安装该软件。
打开命令提示符作为管理员,然后复制粘贴下一个命令:
xperf -start perf!GeneralProfiles.InBuffer && timeout -1 && xperf -stop perf!GeneralProfiles.InBuffer myTrace.etl
按ENTER 一次要启动命令,现在您必须等到连接断开。
- 连接断开后您前往控制台并按下ENTER。
- 等待一段时间后,将会生成一个日志文件 myTrace.etl。
运行以下命令来显示该文件:
xperf myTrace.etl
如果您想上传它以便我们查看:
- 将 myTrace.etl 压缩为 zip 文件。
- 将此文件的压缩版本放在网上的某个地方(可能是 2shared)。
- 在这里分享链接,我会尝试找出并向您展示问题的原因。