备份检查的最佳实践?

备份检查的最佳实践?

管理员设置了自动备份系统,但忘记了,这种情况很常见。只有在系统出现故障后,管理员才会注意到,备份系统之前已经损坏,或者由于某些故障备份无法恢复,而管理员没有当前备份可以恢复……那么,避免这种情况的最佳做法是什么?

答案1

进行消防演习...每隔几个月最好说 XYZ 系统已关闭...然后实际上按照动作将其重新连接到新的 VM 等等。它使事情保持诚实并帮助您发现错误。

答案2

肥皂盒模式:开启

我想说的是,很简单,没有定期测试的备份是毫无价值的。

我以前的工作中有一项政策,即每个系统(生产、测试​​、开发监控等)都应该每 6 个月进行一次测试恢复。

这也是最初级管理员的工作,以便文档保持最新。初级人员的定义取决于他在特定系统上所做的工作量,有时(实际上经常)是“小组经理”做这项工作

我们有专门用于此的特殊硬件(一个 Intel 和一个 IBM/AIX 机箱),除了磁盘空间之外,其他所有东西的规格都很低,因为我们不需要在恢复的主机上运行任何实际的东西。

前几轮的工作相当多,但它使我们简化了恢复过程,这是备份的重要部分。

答案3

由于您似乎指的是管理员没有注意到备份工作“中断”,而不是工作备份没有正常工作,我建议围绕备份构建某种监控脚本。

在构建自主开发的备份解决方案时,我会做这样的事情:

  • 创建一个脚本来备份您的数据。
  • 执行测试恢复以确保脚本正常运行。
  • 在脚本中或通过其他方式实现一种跟踪备份状态的方法(成功、失败、运行、未运行)。
  • 监控跟踪状态(电子邮件、数据库等)

一旦完成所有这些,您就应该没问题了。还有一件事要做,那就是定期进行测试恢复。如果您有多余的硬件可以捐赠给这个事业的话。

在我工作的地方,我们有一个温站点,每月一次,我们随机选择一个系统或数据库,进入我们的温站点,在裸机上执行测试恢复练习,以确保能够恢复我们的数据。

老实说,如果你的数据对你来说非常重要,那么投资一些软件来管理你的备份对你来说才是最好的选择。市场上有数百种产品可以做到这一点,从便宜简单的到企业级的都有。

如果您依靠 crontab 中运行的一组手写脚本来进行公司备份,那么您迟早会遇到麻烦。

答案4

一种方法是编写一个定期运行的“恢复”作业脚本,例如从最近的备份中抓取特定文本文件并通过电子邮件将其内容发送给您。如果可能的话,至少有时应该使用与创建或备份数据的机器不同的机器来完成此操作,以确保在需要时它可以正常工作。这样做的好处是您可以确保加密/解密、压缩和存储机制都正常工作。

对于电子邮件和数据库服务器等专门的备份来说,这稍微复杂一些,尽管从小型数据库或砖级邮箱备份执行某种小规模恢复并验证内容当然是可能的,只是稍微复杂一些。

这种方法也不能取代定期的完整恢复,以确保您可以在紧急情况下恢复数据 - 它只是让您对日常备份工作的完整性更有信心。

相关内容