Windows Server 2012 BSoD 上的 Exchange 2016

Question 1

您的存储系统出现故障或速度太慢，无法跟上。如果 IO 停滞时间过长，Exchange 会认为存储已死，并终止 Wininit 以强制硬重置。

看https://technet.microsoft.com/en-us/library/ff625233.aspx并滚动到末尾。2013 年和 2016 年也是如此。

在某些情况下，整个存储堆栈可能会受到挂起的影响，从而无法将失败事件写入 Crimson 通道或 Windows 事件日志的任何其他区域。ESE 还通过验证是否可以写入事件日志来监视 Crimson 通道。如果写入事件日志长时间失败，MSExchangeRepl 会通过终止 wininit.exe 故意导致 Windows 的错误检查。当操作系统 I/O 挂起时，系统显然无法将任何 ESE 事件写入事件日志。

我使用 Windows Server Backup 备份 Exchange 时亲身经历过这种情况。备份开始时，它会并行对所有数据库进行一致性检查。当存储丢失时，这会导致 Exchange 在几分钟后进入 BSoD。

第一个解决方案是禁用 ATS 心跳到存储阵列 https://kb.vmware.com/kb/2113956

文本太长，无法复制，但 TL;DR：当 ATS 8 秒心跳超时时，您的存储阵列连接可能会在重度 IO 下断开，这将导致 VM 中的 IO 超时，从而导致 Exchange BSoD。

第二种解决方案是向 VM 添加存储控制器并在控制器之间分配数据库磁盘。就我而言，单个 pvscsi 控制器在 6 个数据库下会严重阻塞，但当磁盘（包括操作系统磁盘等）分布在 4 个 pvscsi 控制器上时，问题就消失了。我没有这方面的参考，只是在 vSphere 5.5 U3 上的个人经验。

Answer

您的存储系统出现故障或速度太慢，无法跟上。如果 IO 停滞时间过长，Exchange 会认为存储已死，并终止 Wininit 以强制硬重置。

看https://technet.microsoft.com/en-us/library/ff625233.aspx并滚动到末尾。2013 年和 2016 年也是如此。

在某些情况下，整个存储堆栈可能会受到挂起的影响，从而无法将失败事件写入 Crimson 通道或 Windows 事件日志的任何其他区域。ESE 还通过验证是否可以写入事件日志来监视 Crimson 通道。如果写入事件日志长时间失败，MSExchangeRepl 会通过终止 wininit.exe 故意导致 Windows 的错误检查。当操作系统 I/O 挂起时，系统显然无法将任何 ESE 事件写入事件日志。

我使用 Windows Server Backup 备份 Exchange 时亲身经历过这种情况。备份开始时，它会并行对所有数据库进行一致性检查。当存储丢失时，这会导致 Exchange 在几分钟后进入 BSoD。

第一个解决方案是禁用 ATS 心跳到存储阵列 https://kb.vmware.com/kb/2113956

文本太长，无法复制，但 TL;DR：当 ATS 8 秒心跳超时时，您的存储阵列连接可能会在重度 IO 下断开，这将导致 VM 中的 IO 超时，从而导致 Exchange BSoD。

第二种解决方案是向 VM 添加存储控制器并在控制器之间分配数据库磁盘。就我而言，单个 pvscsi 控制器在 6 个数据库下会严重阻塞，但当磁盘（包括操作系统磁盘等）分布在 4 个 pvscsi 控制器上时，问题就消失了。我没有这方面的参考，只是在 vSphere 5.5 U3 上的个人经验。

Question 2

您可以发出命令来禁用 ESE 强制重启，Don 的回答很好地解释了原因。

我最近为一个拥有一台 ESXi 服务器的客户做了这件事，因为 IO 过度消耗了 Exchange。（它仍然在消耗它，因为例如仅仅打开一个管理控制台就需要很长时间，但至少它不会重新启动..）

Add-GlobalMonitoringOverride -Identity Exchange\ActiveDirectoryConnectivityConfigDCServerReboot -ItemType Responder -PropertyName Enabled -PropertyValue 0 -ApplyVersion '15.0.712.24'

在那里您需要使用正确的 Exchange 版本。

有关 Exchange 版本请参阅此处；https://technet.microsoft.com/en-us/library/hh135098(v=exchg.150).aspx

更多详细信息请参阅此处；http://www.tecfused.com/2014/11/exchange-2013-dag-bsod/

Answer