早在 2016 年,我们就为一位客户部署了一个解决方案,该解决方案是 Windows 2012 R2 RDS 解决方案,其中包含 2 个会话主机服务器、一个 Web 服务器、几个文件服务器、一个 SQL 服务器和一个交换服务器。
自上线以来,我们遇到了许多性能问题。大多数问题似乎归咎于网络/通信,但很难查明确切的问题。
当我们构建解决方案时,我们部署了一台 2012 R2 机器并将其系统准备到模板中;我们现在相信该安装存在潜在问题。
客户的内部系统是一个带有 SQL 数据库的 ASP 网站。他们不断报告速度问题,即使是最简单的数据库查询也是如此。有时保存作业注释实际上会超时并失败,而这应该只不过是“INSERT INTO blah blah”而已。
此外,将文件从一台服务器复制到另一台服务器时也出现了问题。最初,我们能够重现一个问题,即当将文件从服务器 1 上的共享复制到服务器 2 上的共享时,整个服务器会冻结一段时间(有时是几分钟)。我们调整并更新了一些东西,并解决了一半问题,但用户仍然报告说,它间歇性地无法以合适的速度复制文件。
我们还遇到了会话主机服务器上 Outlook 报告随机网络错误和崩溃的问题。有时当您尝试重新打开 Outlook 时,它会报告网络问题阻止与 Exchange 的连接。几秒钟后它就会正常打开。这又是完全断断续续的。
我们已经排除了几乎所有我们能想到的问题。仅举几个例子...
- 我们重新安装了所有的虚拟机管理程序。
- 我们平整了 SAN 并重建了它。
- 我们重建了网络(全线10Gb光纤)。
- 我们让硬件供应商(戴尔)检查了 SAN 和交换机是否存在错误……没有发现任何错误。
- 我们删除并重建了每个虚拟机上的网络堆栈。
- 我们删除了 NIC 组合。
- 我们安装了所有可用的更新。
我实际上已经从头开始重新部署了一些服务器,这次是 Windows Server 2016,看看我是否可以克服这些问题。令人恼火的是,这样做之后,相应的问题立即得到了解决。
例如,当我重建文件服务器时,它们之间的文件复制现在几乎是即时的 - 根本没有延迟或问题的报告。此外,当我重建 Web 服务器和 SQL 服务器时,SQL 等待处理任务以及有时无法保存笔记等问题已立即得到解决。
我真的不想重建交换服务器或会话主机服务器,而且我已经证明就地升级不会起作用(在其中一个文件服务器上尝试过),所以我希望我可以找出问题的根本原因并解决它。
我很清楚,我没有提供足够的信息来自信地指出罪魁祸首,但是有人遇到过类似的事情并找到了原因,或者有人知道罪魁祸首可能是什么吗?
如果我无法尽快找到问题的根源,我计划向微软提出支持案例...我很乐意支付支持费用,但即使这样做也需要我能够准确地确定问题范围以确保它到达正确的团队,而且很难确定范围...见鬼,我正在努力为这篇文章挑选标签。
欢迎任何帮助、想法或建议。
提前致谢。