情况：

Question 1

我的建议是完全避免这个问题。您提到增加成本和完全重新架构是阻碍因素，但在这种情况下您可以考虑在双节点故障转移群集中的主机上安装两个存储虚拟机。这样您就可以修补其中任何一个（但不能同时修补两个），而不会影响群集提供的 NFS 或 iSCSI 的可用性。它仍然不是一个受支持的解决方案，但它至少允许一定的维护灵活性，但代价是增加资源开销（主要是您为第二个存储虚拟机提供的内存量）。

如果改变架构完全不可接受，那么最安全的选择就是关闭虚拟机。

下一个最佳解决方案是启用虚拟机的休眠功能。休眠功能可确保所有文件系统都处于静止状态，从而有助于避免可能的损坏。

接下来，您可以对具有内存状态的虚拟机进行快照，强制终止虚拟机的进程，然后在完成后恢复到快照。这可能会导致一小段时间的数据丢失，但我敢肯定，您永远不会在维护窗口之外尝试这样做，因为任何数据丢失都是不可接受的，所以这应该是相当无关紧要的。此解决方案与制作快照一样快，可确保虚拟机不会抱怨磁盘丢失，但确实会导致潜在的数据丢失。

最后，如果您想暂停进程（并且已经测试过它确实有效），那么我强烈建议您首先同步客户机中的所有磁盘（在 Linux 中，这可以通过 /bin/sync 完成。SysInternals 为 Windows 提供的实用程序：http://technet.microsoft.com/en-us/sysinternals/bb897438.aspx)，并快速进行维护，以免时钟调得太慢。

至于潜在的副作用，任何 AD 连接的机器必须（默认情况下）与 DC 的时间相差 5 分钟。因此，在采用任何解决方案后，如果 VM 不是持续可用（除了正常关机），我建议您强制恢复的客户机更新其时钟。在数据库服务器上，不要在服务器繁忙时执行这些操作，因为这会增加文件系统损坏的可能性。

除了正常关机或高可用性存储之外，所有选项的主要风险是损坏。缓冲区中的一些 I/O 可能会被丢弃，应用程序可能会误以为这些 I/O 已成功完成。更糟糕的是，I/O 可能已被较低层重新排序，以实现更优化的写入模式。这可能导致数据部分无序写入。也许在写入数据库行的数据之前行数已增加，或者在校验和数据物理更改之前校验和已更新。这可以通过仅允许同步写入存储来缓解，但会以牺牲性能为代价。

Answer

我的建议是完全避免这个问题。您提到增加成本和完全重新架构是阻碍因素，但在这种情况下您可以考虑在双节点故障转移群集中的主机上安装两个存储虚拟机。这样您就可以修补其中任何一个（但不能同时修补两个），而不会影响群集提供的 NFS 或 iSCSI 的可用性。它仍然不是一个受支持的解决方案，但它至少允许一定的维护灵活性，但代价是增加资源开销（主要是您为第二个存储虚拟机提供的内存量）。

如果改变架构完全不可接受，那么最安全的选择就是关闭虚拟机。

下一个最佳解决方案是启用虚拟机的休眠功能。休眠功能可确保所有文件系统都处于静止状态，从而有助于避免可能的损坏。

接下来，您可以对具有内存状态的虚拟机进行快照，强制终止虚拟机的进程，然后在完成后恢复到快照。这可能会导致一小段时间的数据丢失，但我敢肯定，您永远不会在维护窗口之外尝试这样做，因为任何数据丢失都是不可接受的，所以这应该是相当无关紧要的。此解决方案与制作快照一样快，可确保虚拟机不会抱怨磁盘丢失，但确实会导致潜在的数据丢失。

最后，如果您想暂停进程（并且已经测试过它确实有效），那么我强烈建议您首先同步客户机中的所有磁盘（在 Linux 中，这可以通过 /bin/sync 完成。SysInternals 为 Windows 提供的实用程序：http://technet.microsoft.com/en-us/sysinternals/bb897438.aspx)，并快速进行维护，以免时钟调得太慢。

至于潜在的副作用，任何 AD 连接的机器必须（默认情况下）与 DC 的时间相差 5 分钟。因此，在采用任何解决方案后，如果 VM 不是持续可用（除了正常关机），我建议您强制恢复的客户机更新其时钟。在数据库服务器上，不要在服务器繁忙时执行这些操作，因为这会增加文件系统损坏的可能性。

除了正常关机或高可用性存储之外，所有选项的主要风险是损坏。缓冲区中的一些 I/O 可能会被丢弃，应用程序可能会误以为这些 I/O 已成功完成。更糟糕的是，I/O 可能已被较低层重新排序，以实现更优化的写入模式。这可能导致数据部分无序写入。也许在写入数据库行的数据之前行数已增加，或者在校验和数据物理更改之前校验和已更新。这可以通过仅允许同步写入存储来缓解，但会以牺牲性能为代价。

Question 2

好问题...

但是为什么需要重新启动 NFS 服务器呢？

一体化设计不再合理。作为科学实验或小型家庭实验室的情况，当然可以。但与任何解决方案一样，在必要时预计会建立停机时间和维护窗口。

所以...

设置虚拟机启动和关闭顺序（有这个好事）。

您可以选择同时关闭或暂停多台虚拟机。（我曾经暂停当我这样做时虚拟机

对 NFS VM 执行任何您需要的操作。
吃掉停机时间。

如果你不能承受这种类型的停机，你就不应该运行一体化存储和虚拟机设置，或者应该考虑传统的 SAN 存储（或低成本版本）以及多个 VM 主机。

Answer

好问题...

但是为什么需要重新启动 NFS 服务器呢？

一体化设计不再合理。作为科学实验或小型家庭实验室的情况，当然可以。但与任何解决方案一样，在必要时预计会建立停机时间和维护窗口。

所以...

设置虚拟机启动和关闭顺序（有这个好事）。

您可以选择同时关闭或暂停多台虚拟机。（我曾经暂停当我这样做时虚拟机

对 NFS VM 执行任何您需要的操作。
吃掉停机时间。

如果你不能承受这种类型的停机，你就不应该运行一体化存储和虚拟机设置，或者应该考虑传统的 SAN 存储（或低成本版本）以及多个 VM 主机。

Question 3

哪种方法更可取，或者它们同样好/坏？

两者都不。

这是糟糕设计的代价，除了关闭虚拟机、处理存储虚拟机然后重新启动其他虚拟机之外，我不会采取任何措施让这种情况变得更糟。我还会找人使用受支持/可支持的架构重新设计您的设置。

在数据库、Active Directory 控制器、用户正在运行作业的机器等特殊情况下，会产生哪些意外的副作用？

它本质上是不可预测的，如果你再这样做，这次可能发生的事可能不会发生。这是无法忍受的。

哪些地方需要注意？链接博客上的一条评论提到，例如，当 CPU 冻结时可能会出现计时问题。

很难建设性地回答这个问题。

Answer

哪种方法更可取，或者它们同样好/坏？

两者都不。

这是糟糕设计的代价，除了关闭虚拟机、处理存储虚拟机然后重新启动其他虚拟机之外，我不会采取任何措施让这种情况变得更糟。我还会找人使用受支持/可支持的架构重新设计您的设置。

在数据库、Active Directory 控制器、用户正在运行作业的机器等特殊情况下，会产生哪些意外的副作用？

它本质上是不可预测的，如果你再这样做，这次可能发生的事可能不会发生。这是无法忍受的。

哪些地方需要注意？链接博客上的一条评论提到，例如，当 CPU 冻结时可能会出现计时问题。

很难建设性地回答这个问题。

情况：

情况：

可能的解决方案...

...还有问题吗？

编辑：澄清这个问题的范围

因此，重新表述这些问题：

答案1

答案2

答案3

相关内容