是否可以通过 WAN 链路进行实时或同步复制?

是否可以通过 WAN 链路进行实时或同步复制?

我所在的公司希望通过跨越 2000 多英里的 WAN 链路实现真正的实时文件复制和文件锁定。我们目前在东海岸办公室设置了 16 驱动器 SAN。我们在科罗拉多州的办公室也将设置完全相同的 SAN。我们的想法是让这两个 SAN 始终包含完全相同的数据,这将使我们能够使用相同的数据池,并且如果任一端发生故障,它还将提供异地备份解决方案。我们正在运行 Server 2008。

目标是让东海岸办公室的用户能够处理文件,并且这些更改也会立即更新到科罗拉多 SAN 上。我们还需要文件锁定,这样当用户尝试处理同一个文件时就不会发生冲突或更改被覆盖。

这种场景是否可能实现,速度是否足以让文件可用?如果可以,我们需要什么软件来实现?据我所知,DFS-R 不提供文件锁定,因此如果我们使用该文件,则需要使用第三方产品,如 Peerlock。但我甚至不知道 DFS-R 是否是一种选择。它可以通过 WAN 链路快速复制吗?任何产品都可以吗?似乎如果我们使用同步复制,程序会慢得令人无法接受,因为每次写入都必须等待链路另一端的确认。但如果我们使用异步复制,我们将面临什么样的延迟?GlobalScape 有一款名为 WAFS 的产品,声称可以提供“具有实时文件锁定、文件发布和同步的文件一致性”,并表示“在修改文件时,使用智能字节级差异立即镜像更改,以最大限度地减少对网络带宽的影响”。因此,这听起来像是同步复制,但考虑到光速等物理限制,这似乎是不可能的。

如果有人有这种设置的经验,或者知道是否可行,我将非常感谢您提出的意见和建议,包括我们应该检查的软件推荐。

答案1

是否可能取决于两件事(也许是三件事):

  1. 变化率(即每天污染多少个区块)和
  2. 两个站点之间的链路带宽。
  3. 您需要复制的原始数据

如果变化率太高,无论多少数据压缩都无法帮助您复制。

对于大量数据,变化率低且链接速度慢,FedEx 可以使用“种子”数据来启动复制,从而取得良好的开端。除此之外,没有违反物理定律。

答案2

看看 Riverbed Steelhead 设备如何帮助解决办公室之间的延迟问题。它们还提供了其他一些巧妙的方法来管理远程办公室的数据。当然,您的解决方案还有其他部分,但这些设备在我们的场景中确实很有帮助。河床

答案3

在每个站点部署 Linux 服务器(可以是虚拟机),并设置 Samba,将其配置为使用http://wiki.apache.org/hadoop/MountableHDFSroot。HDFS 将进行复制和锁定。

相关内容