目前,我使用创建 tarball 的简单 shell 脚本备份我的个人文件。该脚本每小时由 cron 运行一次。
我计划切换到增量备份(我将使用 duplicity),因为这将最大限度地减少通过网络的数据传输。
这让我想到一些常见问题:
- 进行增量备份时,应选择哪种策略?据我了解,这种策略意味着先创建完整备份,然后再进行一些增量备份。在某个时候,会再次进行完整备份并开始新的备份。我的问题是我不知道如何决定应该多久进行一次完整备份。如果我每小时进行一次备份,那么从一天开始进行完整备份,然后再进行增量备份是否合理,或者是否有更好的策略?
- 在开始轮换备份之前我应该保留多少套完整的备份?
答案1
正确答案取决于以下问题:
- 您的备份设备上有多少可用空间
- 您想将备份保留多长时间?
- 您的数据多久更改一次?
- 什么是“变化率”(完整备份之间会有多少数据发生变化?)我读到过,对于许多企业来说,5% 的变化率是典型的。您的个人文件的变化率可能高于或低于这个数字。
除非您有特殊需要,否则请尽量保持计划简单。复杂的备份计划可能会在恢复期间造成混乱,您肯定不希望在恢复期间出现更多混乱。
许多备份产品都提供类似于以下的简单默认备份计划。您可以轻松地根据未来需求采用该计划。
- 每月完成一次,保存一年。周日完成。
- 每周完成一次,保存一个月。周日完成。
每日增量,维持2周。
对于大多数人来说,每小时的增量听起来太频繁了,因为文件不会经常改变。
答案2
增量备份完全是 PITA,应该尽可能避免。
如果网络带宽确实是一个问题,那么我建议在其他地方维护镜像并使用 rsync/unison 从源复制,然后在目标上创建刷新图像的连贯 tarball。