我一直使用 rsnapshot 成功备份一些服务器,并且对它感到比较满意,除了一个主要问题:监控。
对于使用 rsnapshot 的用户,您如何监控它?我希望有某种方法来验证 rsnapshot 是否正在运行、是否正在提取文件以及总体而言是否按应有的方式运行。如果不是,我应该立即收到电子邮件,以便修复故障。
显然,这不能代替定期测试恢复文件,这是我过去发现问题的方法。我只是希望有更自动化的方法添加我的测试方案这样一些错误就可以更快地被发现和纠正。
您用什么来监控 rsnapshot?或者,您的备份监控策略一般是什么?
答案1
将其添加到类似日志检查,总结它所引发的任何问题将是一个好的开始。
答案2
除了日志扫描之外,还可以执行稍微自动化一些的检查。
例如,我有一个脚本,它在多个文件区域及其各自的备份之间执行“rsync -a --dry-run”,并通过电子邮件将结果发送给我。它每周通过 cron 运行一次,或者我有时手动运行它。预计会有细微差异,因为自上次每日备份以来通常会有变化,但显著差异会显示某些问题。
对于我的邮件服务器(运行 F/OSS 版 Zimbra 的 VM),我还有一个 VM 副本,它偶尔会删除其邮件存储并恢复主服务器的最新备份。我每周的手动检查之一是登录“备份测试”VM,确保它正常运行并具有所有应有的最近更改。我也可以为此手动启动测试过程。