我有一个开发箱,它(几乎每天晚上)都会出现相同的症状:
无法使用 RDP,因为“死机黑屏”
无法发出远程 powershell 命令,因为“远程注册表”服务卡在“正在启动...”状态。无法使用“Stop-Process”终止进程,“Get-Process”返回错误:
Get-Process:无法连接到远程机器。
- 无法重新启动 RDP 服务(远程),因为“远程桌面服务用户模式端口重定向器”服务卡在“正在停止...”状态,尝试时出现以下错误:
错误 1061:服务现在无法接受控制消息。
无法使用“调用命令“由于安全限制。
事实上,如果您尝试远程重新启动该框上的任何服务,它就会卡在“正在启动...”状态。
(SQL Server)仍然能够连接,但遇到与 SQL Agent 相关的各种问题
我仍然可以通过 AWS 重新启动该设备,但第二天晚上它仍会执行相同的操作,事件日志不包含任何指示此服务器上正在发生什么的信息。我确实在系统日志中看到了以下消息:
服务器 {XXX} 未在要求的超时时间内向 DCOM 注册。
不要真的告诉我我的服务器“坏了”......
我不知道如何确定这个问题的根本原因。有人遇到过这种问题吗?如果有,您找到了什么解决方案?
更新 1
问题变得更加严重,发展成每 15 分钟我就会被从 RDP 中启动一次,并且需要不断强制停止实例的情况,我使用旧的数据驱动器(但新的 C 盘)将服务器替换为新的服务器,但每隔一天在新服务器上仍然会遇到这个问题。
我已经启用了远程 powershell,即使无法使用 RDP 也可以使用它,我也会收集性能指标并附加到此票证。
更新 2
好的,我正在取得进展,当我尝试与被锁定的系统建立远程连接时,远程直接冻结,以下命令(powershell)永远不会完成:
$session = New-PSSession -ComputerName DXYZServerNameHere
我在服务器上启用了本地管理员帐户,这样我就可以连接到它而无需针对我的集中式 AD 服务器运行,但这也不起作用,仍然会出现死机黑屏。
我有一个针对服务器运行的监控产品,有时当服务器不可用时它会停止报告,其他时候它会继续报告大部分空闲数字(CPU 在 10% 以下,内存充足,没有超重的 HD 使用率)。
我的一位同事发现可以从另一个系统上的“服务器管理器”重新启动服务器,但这并不能真正解决问题。
我在其他服务器上较少遇到此问题,一般我只需重新启动它们即可短期修复此问题。
此时我已经没有什么想法了,我会继续寻找,看看是否还有其他人有想法......