我查看了其他问题,但没有一个真正回答了我需要知道的问题。我应该采取哪些步骤来为服务器和工作站构建有效的灾难恢复策略?
我在这里谈论的是设置备份、重影系统等类似事项。
我正在寻找可以传达给我老板的建议,理想情况下是“优雅地降低成本”的解决方案。
即:如果我们的服务器发生故障(就像刚才的情况一样),我们负担不起快速安装替换件的费用,而且我们也没有可能在出现问题时保留备用件。理想情况下,我建议在两个域控制器上使用强大的硬件 RAID,然后是成本较低的选项,然后是最便宜的选项。现在,我们每晚都会将共享驱动器备份到另一个驱动器,并将其插入我同事的 PC 上。
我很确定,在我老板眼里,最便宜的选择就是最好的,但我想确保他明白,获得维持服务器和工作站正常运行所需的一切是多么重要。
答案1
只是为了 10000% 清楚。
你的服务器应该有 RAID还,RAID 不是备份。
综上所述,VMWare 使服务器灾难恢复变得简单。您可以编写每日一次的快照,并将所有服务器 VMDK(虚拟驱动器)复制到另一个工作站或廉价的网络附加存储设备。如果您的 ESX/ESXi 服务器崩溃,您可以在紧急情况下在笔记本电脑或廉价服务器上运行 ESXi。无需重新配置,无需恢复,只需很少的设置。
根据我与客户合作的经验,台式工作站通常因非硬盘问题而死机。如果电源坏了并烧坏了硬盘,那么如果你有 RAID,它就会烧坏它们两个。
我对工作站的建议:
- 购买优质的商务级机器(戴尔 Optiplex,不是百思买当天的特价商品)。
- 考虑每周将它们备份到外部硬盘驱动器(?),或使用 Windows NTBackup 每天将重要文件备份到“备份服务器”。
- 关键工作站上的 UPS(APC 名牌)。
- 工作站在保修期内,因此零件第二天交付(例如戴尔)。
我对服务器的建议:
- RAID。必需。如果您买不起硬件 RAID,那么在许多情况下,软件 RAID 似乎与硬件 RAID 一样好用。
- 备份。每晚备份。如果经济条件允许,可以实时备份。
- VMWare ESXi。
- APC 电池备份。
备份服务器可以是办公室里的一台旧电脑、一个便宜的 SATA 控制器和 3 个 RAID5 中的 1TB 驱动器。将机器备份到具有 2TB 存储空间的备份服务器的总投资应小于 500 美元。
在你制定了计划并付诸实施之后——测试.然后定期安排测试。
关于备用硬件——在一小部分机器中,我认为你会发现故障完全是随机的。拥有额外的硬盘和电源可能永远都用不上。我会手头备有一台配置好的备用工作站,如果需要的话,只需从 Newegg 订购零件即可。
答案2
《系统和网络管理实践》第 21 章提供了您真正需要的详细信息理解备份,尤其是策略。
请记住:备份不只是用于服务器着火或磁盘故障时。RAID 不是备份解决方案,RAID 是硬件故障转移解决方案。当您或您的用户意外删除不该删除的文件时,备份就派上用场了。当某些软件损坏文件或进行不该进行的更改时,备份就派上用场了。备份还用于存档目的,例如用于记录 DHCP 租约,这样当警察上门说“我们检测到 4 个月前 Z 日期来自 IP Y 的非法活动 X。谁有这个 IP?”
此外,备份不一定很昂贵,但即使很昂贵,当你没有备份时,它们的价值也会增加 10 倍。我们的备份服务器使用廉价的消费硬件,硬盘代替磁带,并且位于现场(在数据中心,而数据中心恰好位于一个地下室,据说这个地下室的评级接近原子弹爆炸)。
答案3
廉价资源(无特定顺序)
书籍——备份与恢复(开放系统的廉价备份解决方案) http://oreilly.com/catalog/9780596102463
首先制定一个计划...事实上制定三个计划...然后与你的老板沟通并让他“选择”一个。
Clonezilla——免费备份/映像驱动器的方式。
JungleDisk——一种廉价(且简单)的异地备份重要文件的方法。
至于硬件……那永远是个问题。如果你的电源坏了……你就需要换一个新的。如果你的主板坏了……你就需要换一个新的……如果你的……你懂的。
我确信每个人都会大声喊出这一点,但请记住... RAID 不是备份!:-)
只有您(和您的老板)才能够确定您的停机时间(和重建时间)是否值得拥有“热备用”服务器或仅仅几个常用备件。
如果您真的想节省开支……至少去购买一个 1TB 的 USB 驱动器,大约 80 美元,然后每 ___ 天/周使用 clonezilla 备份服务器一次。
我认为这里的关键是想出一个计划(或几个选项),然后以一种明智的方式与你的老板交谈。告诉他每个选项的利弊,然后让他决定如何进行。
答案4
据我所知,我需要的没有特定的顺序:
对于数据备份
- 硬件 RAID
- 服务器复制
- 异地备份,由第三方或自制
为了系统稳定性
- 系统备份(使用 Ghost 或同等软件)
- 尽可能在大多数工作站上使用统一的硬件
- 为最有可能很快损坏的硬件提供必要的备件