您如何备份您的网站?

您如何备份您的网站?

您如何备份您的网站?如果您的网站很大(20GB+),包含数千个文件,我对此尤其感兴趣。

有什么比通常的更聪明的吗tar -zcvf backup2010.tar.gz ./public_html/

回答完上述问题后,如何保持一致的备份程序?

感谢大家的帮助

答案1

同步是一个仅复制增量(文件中的更改)的质量工具:

rsync --partial --progress --rsh=ssh ./public_html/ [email protected]:/permitted/path

这将备份尽可能少的数据以同步您的两个目录。

为了创建备份,我建议在远程机器上运行问题中的 tar 命令,这样您每天仍有一个存档,但带宽使用率尽可能低。您可以在 rsync 备份中包含 SQL 数据库转储(而不是原始表!),但要确保它们不会出现在面向公众的目录中!

为了保持一致的备份过程,请按计划执行这些任务。

不要忘记编写脚本并测试您的恢复过程!糟糕的备份毫无价值。

答案2

已经有一个页面,里面有比我能数得出来的更多的选项,具体取决于你的需求,轻松、自动的快照式备份

我经常使用的工具是备份. rlbackup 创建 hourly.0、hourly.1、daily.0、daily.1、daily.2、weekly.0、weekly.1 等目录。旧副本会自动轮换和删除。最昂贵的运行通常是第一次每小时运行。每次后续运行都只会传输已更改、新增或已删除的文件。这些目录提供了易于浏览的“时间快照”。可以将其视为穷人版的重复数据删除。

尽管如此,rsync 也有其自身的性能损失。Linux 周刊新闻发表了一篇文章尽管如此,rsync 确实有它能处理好和不能处理的上限。无论您有数百万个中等文件还是数百个大文件,您都需要测试纯性能。如果您的数据很少改变每天都会在您的网站上发布新内容,但一切通常都是新的,所以情况可能不会太糟。

在“文件大部分是新文件”的情况下,rsync 可能效果不错。但如果大部分备份是 SQL 数据库,那么您需要重新考虑整个方法。

答案3

从你建议使用 tar 来看,我推测你使用的是 Unix。鉴于巴库拉非常可靠。安装起来有点麻烦,但一旦配置好,它就能非常可靠地运行。您可以使用许多功能 - 多个客户端(当然)、多个磁带驱动器、unix/windows 客户端(可能还有 MacOS,尽管我不能肯定)、加密备份磁带、裸机恢复(和其他灾难恢复功能)、备份到光盘或 WORM 介质(例如 DVD-R)。我并没有使用所有这些功能,但我使用过其中的很多功能,bacula 在许多场合救了我一命 - 也在许多场合救了我的用户一命。

我要转达一位同事的一个建议,我同意这个建议,那就是 bacula 与磁带库配合使用的效果比与单个磁带驱动器配合使用要好得多。一台旧堆叠器的价格很便宜(我在家里使用一台 6 磁带 DDS-4 堆叠器,我花了不到 200 英镑买的),如果你说的是数十 GB 和数千个文件,我认为这样的投资可能在你的承受范围内。

我也承认,现在普遍的观点是磁盘非常便宜,备份到顺序存储设备(即磁带)是一种过时的技术。我只能说,只需再花一盒磁带的钱,我就可以将我的时间点恢复能力从四个月延长到八个月,而且不用的磁带比硬盘更容易转移到异地。

答案4

我经常使用同步。仔细阅读文档,有很多有趣的可能性,例如保留所有已更改文件的备份。Rsync 仅传输已更改的文件,因此如果您没有太多文件,它会非常高效。

备份管理器非常有趣:在 Debian 上轻松安装,配置非常快速,差异 tarball 备份,mysql 备份,通过 samba 传输,ftp...

还有这个工具可能很有趣:rdiff-备份但我没有这方面的经验。

每天使用 cron 启动这些工具,将备份保存在不同的主机上,经常检查备份(最佳做法是进行恢复测试),尝试加密备份(以防有人窃取它们...),在发生重大灾难时将一些备份移出现场...

相关内容