我想对 S3 进行一些备份,并希望尽可能减少带宽。我正在考虑几个选项。看来 librsync 是低带宽远程备份的最佳解决方案。
我一直在阅读 librsync 的工作原理。似乎远程端需要计算它正在比较的文件块的校验和(以及本地端)。我认为 S3 无法进行这些校验和计算,因为它只提供文件服务。
我还读到 S3 不支持将文件分成块。它只能提供整个文件或什么都不提供。
如果这两个或其中一个陈述都是正确的,那么 librsync 是否基本上是无用的?有人能帮我解释一下吗?
谢谢。
答案1
我认为 librsync 只是算法的一个实现。它可以以多种方式使用。“正常”使用模式(如原始 rsync 程序中使用的模式)确实需要接收方支持远程哈希生成。 表里不一也使用 librsync,但它预先计算哈希值,因此不需要文件存储之外的远程支持。
更多信息:http://en.wikipedia.org/wiki/Rsync。 具体来说:
duplicity 是 rdiff-backup 的一个变体,允许在无需存储服务器配合的情况下进行备份,就像使用 Amazon S3 等简单存储服务一样。它的工作原理是预先为每个块生成哈希值,对其进行加密,并将其存储在服务器上,然后在进行增量备份时检索它们。出于安全目的,其余数据也以加密形式存储。
我也在研究,但如果使用 Duplicity,禁用 SSL(s3-unencrypted-connection)并增加 volsize 参数应该有助于节省带宽。