当裂脑造成安全漏洞时，网络分区的风险

Question 1

我曾经在集群场景中处理过类似的问题，因此对您描述的情况很熟悉。此类系统通常具有仲裁的概念，这就是为什么此类系统需要奇数个成员节点。仲裁用于确定多数分区和少数分区。

仲裁数是一个大于一半的数字，它定义了提供服务所需的最小可用节点数。如果发生网络分区，则只有一个分区具有仲裁数，另一个分区将停止服务，直到分区消失。如果多个分区事件发生时，可能会导致根本不提供服务。但是，它确实保证只有一个节点在提供服务，这就是提供一致性的方式。

至于分区的可能性，这取决于您的基础设施以及您的节点如何相互传达可用性状态。

至于它们检测分区事件的能力，这取决于你的代码。使这种攻击成为可能的主要原因是两个分区都可独立寻址在分区期间，情况可能并非如此。根据我的经验，网络分区经常会将最终用户排除在一个分区以及其他节点之外。如果分区不可寻址，那么这种攻击成功的可能性就会大大降低。

Answer

我曾经在集群场景中处理过类似的问题，因此对您描述的情况很熟悉。此类系统通常具有仲裁的概念，这就是为什么此类系统需要奇数个成员节点。仲裁用于确定多数分区和少数分区。

仲裁数是一个大于一半的数字，它定义了提供服务所需的最小可用节点数。如果发生网络分区，则只有一个分区具有仲裁数，另一个分区将停止服务，直到分区消失。如果多个分区事件发生时，可能会导致根本不提供服务。但是，它确实保证只有一个节点在提供服务，这就是提供一致性的方式。

至于分区的可能性，这取决于您的基础设施以及您的节点如何相互传达可用性状态。

至于它们检测分区事件的能力，这取决于你的代码。使这种攻击成为可能的主要原因是两个分区都可独立寻址在分区期间，情况可能并非如此。根据我的经验，网络分区经常会将最终用户排除在一个分区以及其他节点之外。如果分区不可寻址，那么这种攻击成功的可能性就会大大降低。

Question 2

分布式存储最适合每 n 秒复制一次单一数据来源，例如使用 SQL 索引和复制规则来推送数据。此外，中央内存“SQL”还用于控制状态。

简单地说，当您改变对象状态时，这会被传达给原始节点，并且事务会在 SQL 中使用记录锁来执行。

如果节点当时无法到达原点，则操作必然失败，因为原点状态仅在原点服务器上。

这类似于原点-边缘工作流，其中原点有“记忆” - 状态，而边缘有“内容” - 对象。

从理论上讲，在保持安全性的同时绕过上述边缘和中央存储器模型并以简单的方式实现这一目标是不可能的。上述模型是最有效和最正确的，对其进行模糊测试只会让事情变得困难。

Answer

分布式存储最适合每 n 秒复制一次单一数据来源，例如使用 SQL 索引和复制规则来推送数据。此外，中央内存“SQL”还用于控制状态。

简单地说，当您改变对象状态时，这会被传达给原始节点，并且事务会在 SQL 中使用记录锁来执行。

如果节点当时无法到达原点，则操作必然失败，因为原点状态仅在原点服务器上。

这类似于原点-边缘工作流，其中原点有“记忆” - 状态，而边缘有“内容” - 对象。

从理论上讲，在保持安全性的同时绕过上述边缘和中央存储器模型并以简单的方式实现这一目标是不可能的。上述模型是最有效和最正确的，对其进行模糊测试只会让事情变得困难。

Question 3

如果您正在寻找一个实用的解决方案以允许交易在分区时继续进行，我有一个想法。

对于每个未使用的新数据记录，将其分配给单个节点。当网络被分区时，分配给可访问节点的数据记录是唯一允许客户端使用的数据记录。当分区解决时，所有节点都会重新同步已使用的数据记录。由于只有客户端可访问的模式才会使用分配给这些节点的记录，因此不应该有超额使用的记录。

必须考虑如何将记录分配给节点，以及在统一和分区操作期间当节点用完其自己的记录时该怎么办。

Answer

如果您正在寻找一个实用的解决方案以允许交易在分区时继续进行，我有一个想法。

对于每个未使用的新数据记录，将其分配给单个节点。当网络被分区时，分配给可访问节点的数据记录是唯一允许客户端使用的数据记录。当分区解决时，所有节点都会重新同步已使用的数据记录。由于只有客户端可访问的模式才会使用分配给这些节点的记录，因此不应该有超额使用的记录。

必须考虑如何将记录分配给节点，以及在统一和分区操作期间当节点用完其自己的记录时该怎么办。

相关内容