我遇到了一个奇怪的问题。在我管理的服务器群中,用户配置文件磁盘会随机停止工作,导致登录的用户(包括管理员用户)无法访问其桌面。
服务器配置
所有服务器均使用 Proxmox 在集群设置中虚拟化。存在以下服务器:
- DC:该服务器主要用作域控制器和文件服务器。
- S:这是一个应用服务器,用作终端服务器,但专门用于某些应用。此服务器使用不多。
- TS(6x):6 个不同的终端服务器,配置相同,运行相同的软件并应用相同的组策略。Office 和 Teams 均已安装,用户拥有 E3 许可证,并使用 ADSync 设置单点登录。
- WEB:代理服务器,也用于通过访问网页启动 RDP 连接。
所有虚拟服务器均运行 Windows Server 2016,并且 Windows 更新均保持最新。
增加了安全性:使用 DUO 移动版进行 RDP Web 和 RDP 网关登录的 2FA。
UserProfileDisks 存储在 DC 上。
问题
用户登录后,代理会根据最少使用量分配服务器,然后服务器会充满成员。在某个随机时刻,通常是在早上,服务器可能会决定停止正常工作。下一个登录的用户无法加载其用户配置文件磁盘,并且会显示黑屏,上面只有一个回收站,开始菜单不起作用。我们可以从 DC 注销用户,如果用户再次登录,如果他们被送回同一台有问题的服务器,这种情况会再次发生。如果他们被送往另一台服务器,他们很幸运,可以正常登录。
目前,每当发生这种情况时,我们都会禁用代理服务器上此 TS 的登录并安排重新启动。重新启动总能解决问题,但考虑到用户在问题发生之前能够登录,我们不能在那时重新启动服务器。话虽如此,我想解决这个问题,这样它就不会再出现了。
当发生这种情况时,我以管理员身份登录,收到一条错误消息,提示 C:\Users\Administrator\Desktop 位置不可用。作为管理员,我可以访问任务管理器,但开始菜单不起作用。我也可以按 CTRL-ALT-END 注销。
如果我转到 C:\Users\,我会看到快捷方式(符号链接)。此时,管理员的快捷方式不再起作用。我可以手动删除它,或者有时在我注销时它会被删除,但一旦删除,它就不会再回来。此时我还会看到很多临时配置文件。当一切正常时,符号链接就会创建,我可以双击它们来访问文件夹。
我在 EventLog 中找不到任何有用的东西,但话说回来,我不知道自己在寻找什么,所以我可能错过了一些显而易见的东西。不过我确实检查了所有错误,没有找到任何可以解释发生了什么的东西。
编辑:我现在找到了可能是根本原因的 eventID,但我不知道为什么会发生这种情况。
EventID:158 磁盘 14 具有与系统连接的一个或多个磁盘相同的磁盘标识符。请转到 Microsoft 的支持网站 (http://support.microsoft.com) 并搜索 KB2983588 来解决该问题。
我查看了所有配置文件磁盘的 GUID,但它们都是唯一的。