为什么不建议不同数据中心的主机使用 GlusterFS 复制卷？

Question

此问题不仅存在于 GlusterFS，还存在于多种类型的数据存储中。这是因为距离增加会导致延迟增加。建议位于同一子网中，以减少因网络跳跃而导致的延迟。

为了保持数据同步，各个服务器必须确保所有服务器都具有相同的数据视图。对于数据读取，延迟效应通常不是问题。但是，如果多个服务器在同步之前写入同一个块，则可能会发生严重的数据损坏。当更新数据块时，可能会丢失更改，如果正在更新的块是在另一台服务器上的后续更新之前读取的，则数据可能会丢失。

可以使用锁定机制来降低损坏风险。但是，随着延迟的增加，分布式锁的获取和释放时间会更长。在这种情况下，延迟是服务器之间完成往返的时间。数据中心之间通信时有三个因素。

邮件数据存储往往是读取最多的。通常，连接到不同服务器的多个客户端不太可能更新同一个文件或目录。传入的电子邮件消息和读取它们的客户端之间可能会存在一些争用，但延迟不应该是一个重大问题。Maildir 格式的存储应该比其他格式的争用相对较少。但是，它们的重命名和移动活动相对较多，如果您的节点断开连接，可能会导致问题。

距离：有线数据在有线上的传输距离约为每纳秒 30 厘米，每微秒 300 米，每毫秒 300 公里。随着距离的增加，延迟会显著增加。
交换时间：数据包经过的每个交换机都需要检查、路由、排队和传输数据包。这会增加额外的延迟，并且随着交换机越来越忙，延迟也会增加。
网络拥塞：网络可能会拥塞，导致流量排队时间更长，并可能重新路由，从而造成额外延迟。如果拥塞严重，延迟时间可能足够长，从而触发数据包重新传输。

Answer 1

此问题不仅存在于 GlusterFS，还存在于多种类型的数据存储中。这是因为距离增加会导致延迟增加。建议位于同一子网中，以减少因网络跳跃而导致的延迟。

为了保持数据同步，各个服务器必须确保所有服务器都具有相同的数据视图。对于数据读取，延迟效应通常不是问题。但是，如果多个服务器在同步之前写入同一个块，则可能会发生严重的数据损坏。当更新数据块时，可能会丢失更改，如果正在更新的块是在另一台服务器上的后续更新之前读取的，则数据可能会丢失。

可以使用锁定机制来降低损坏风险。但是，随着延迟的增加，分布式锁的获取和释放时间会更长。在这种情况下，延迟是服务器之间完成往返的时间。数据中心之间通信时有三个因素。

邮件数据存储往往是读取最多的。通常，连接到不同服务器的多个客户端不太可能更新同一个文件或目录。传入的电子邮件消息和读取它们的客户端之间可能会存在一些争用，但延迟不应该是一个重大问题。Maildir 格式的存储应该比其他格式的争用相对较少。但是，它们的重命名和移动活动相对较多，如果您的节点断开连接，可能会导致问题。

距离：有线数据在有线上的传输距离约为每纳秒 30 厘米，每微秒 300 米，每毫秒 300 公里。随着距离的增加，延迟会显著增加。
交换时间：数据包经过的每个交换机都需要检查、路由、排队和传输数据包。这会增加额外的延迟，并且随着交换机越来越忙，延迟也会增加。
网络拥塞：网络可能会拥塞，导致流量排队时间更长，并可能重新路由，从而造成额外延迟。如果拥塞严重，延迟时间可能足够长，从而触发数据包重新传输。

为什么不建议不同数据中心的主机使用 GlusterFS 复制卷？

答案1

相关内容