您如何备份您的网站?如果您的网站很大(20GB+),包含数千个文件,我对此尤其感兴趣。
有什么比通常的更聪明的吗tar -zcvf backup2010.tar.gz ./public_html/
回答完上述问题后,如何保持一致的备份程序?
感谢大家的帮助
答案1
同步是一个仅复制增量(文件中的更改)的质量工具:
rsync --partial --progress --rsh=ssh ./public_html/ [email protected]:/permitted/path
这将备份尽可能少的数据以同步您的两个目录。
为了创建备份,我建议在远程机器上运行问题中的 tar 命令,这样您每天仍有一个存档,但带宽使用率尽可能低。您可以在 rsync 备份中包含 SQL 数据库转储(而不是原始表!),但要确保它们不会出现在面向公众的目录中!
为了保持一致的备份过程,请按计划执行这些任务。
不要忘记编写脚本并测试您的恢复过程!糟糕的备份毫无价值。
答案2
已经有一个页面,里面有比我能数得出来的更多的选项,具体取决于你的需求,轻松、自动的快照式备份。
我经常使用的工具是备份. rlbackup 创建 hourly.0、hourly.1、daily.0、daily.1、daily.2、weekly.0、weekly.1 等目录。旧副本会自动轮换和删除。最昂贵的运行通常是第一次每小时运行。每次后续运行都只会传输已更改、新增或已删除的文件。这些目录提供了易于浏览的“时间快照”。可以将其视为穷人版的重复数据删除。
尽管如此,rsync 也有其自身的性能损失。Linux 周刊新闻发表了一篇文章尽管如此,rsync 确实有它能处理好和不能处理的上限。无论您有数百万个中等文件还是数百个大文件,您都需要测试纯性能。如果您的数据很少改变每天都会在您的网站上发布新内容,但一切通常都是新的,所以情况可能不会太糟。
在“文件大部分是新文件”的情况下,rsync 可能效果不错。但如果大部分备份是 SQL 数据库,那么您需要重新考虑整个方法。
答案3
从你建议使用 tar 来看,我推测你使用的是 Unix。鉴于巴库拉非常可靠。安装起来有点麻烦,但一旦配置好,它就能非常可靠地运行。您可以使用许多功能 - 多个客户端(当然)、多个磁带驱动器、unix/windows 客户端(可能还有 MacOS,尽管我不能肯定)、加密备份磁带、裸机恢复(和其他灾难恢复功能)、备份到光盘或 WORM 介质(例如 DVD-R)。我并没有使用所有这些功能,但我使用过其中的很多功能,bacula 在许多场合救了我一命 - 也在许多场合救了我的用户一命。
我要转达一位同事的一个建议,我同意这个建议,那就是 bacula 与磁带库配合使用的效果比与单个磁带驱动器配合使用要好得多。一台旧堆叠器的价格很便宜(我在家里使用一台 6 磁带 DDS-4 堆叠器,我花了不到 200 英镑买的),如果你说的是数十 GB 和数千个文件,我认为这样的投资可能在你的承受范围内。
我也承认,现在普遍的观点是磁盘非常便宜,备份到顺序存储设备(即磁带)是一种过时的技术。我只能说,只需再花一盒磁带的钱,我就可以将我的时间点恢复能力从四个月延长到八个月,而且不用的磁带比硬盘更容易转移到异地。