我们有一台独立的 2008 R2 服务器,运行在 ESXi 5.5 上,为客户端提供文件共享。
昨晚它莫名其妙地停止允许入站共享访问。我猜想它正在阻止/丢弃 SMB,但问题是,令我担心的是,没有记录发生了什么。
当电话开始打进来时,我能够成功 ping 和 RDP 到服务器。同时,尝试\\SERVER\Share
以域管理员身份运行,但只是挂起,然后才返回共享不可用。
当我通过 RDP 连接到服务器后,一切似乎都很正常:RAM 和 CPU 使用率很低,所有预期的服务都在运行。事件查看器几乎没有显示任何有用的信息,没有错误,只有常见的信息条目和一些错误,这些错误出现在我的 RDP 会话尝试映射未知打印机时。
在安全日志中,我预计会看到一大堆“Windows 过滤平台丢弃数据包”,这是我们之前见过的很清楚的内容,只是通常的登录事件和审计日志。
与其他共享的出站连接正常,简而言之,我看不出有什么需要修复。
出于绝望,我尝试重新启动服务器服务,但此时整个盒子都冻结了,我不得不按下(虚拟)电源按钮直到它关闭。它恢复正常(谢天谢地),但我很困惑。
我的客户问了一些显而易见的问题,但令人尴尬的是,到目前为止,我还没能给出答案。
有什么想法吗?我几乎不抱希望回到过去并找到这个问题的根本原因,但是对于这类问题的记录或未来测试,还有其他什么可以做的吗?
答案1
我的客户问了一些显而易见的问题,但令人尴尬的是,到目前为止,我还没能给出答案。
所以你说你必须手动重启服务器。事实上相当困难。所有迹象都表明当你使用 RDP 登录时系统运行顺利,对吗?但系统仍然在一夜之间毫无原因地卡住了。
首先,你需要告诉客户,有时没有确切的答案。也许是电涌?也许只是一个小问题。我的服务器已经运行了几个月,没有重新启动,但突然就卡住了。为什么?不知道。重新启动可以解决问题。有时日志可能会有所帮助。
话虽如此,根据您提供的信息,我最好的猜测是存在一些硬件层面的问题。可能是 RAM、硬盘、相关硬件或其他东西。甚至可能是 CPU 本身。
在这种情况下,我最好的做法是安排一个非工作时间的维护窗口,对系统本身进行彻底的硬件检查。如果你不这样做,你就有再次出现此问题或出现完全硬件故障的风险。
答案2
最终,问题被追溯到我们使用的虚拟以太网适配器。它运行在 E1000 适配器上。我将其换成了 VMNet 5 驱动程序,问题就解决了。
值得一提的是,我们使用的是 ESXi 5.1