我主张在面临数据丢失之前实施可靠的备份概念。拥有现场和异地备份是这种概念的支柱之一。然而我了解到元数据有时与实际文件内容一样有价值。
例如,我有一个数据备份和一个恢复的 btrfs 文件系统,需要决定是恢复备份还是保留恢复的数据。由于我缺少文件的校验和,我决定从异地备份恢复。
恢复后,我了解到,文件创建日期、所有权和权限也需要跟踪。幸运的是,我的数据是结构化的,我可以为每个脚本设置默认值。
但是为了改进我的备份计划,我想存储我的文件的元数据。
第一个动作是sha256sum
获取stat
数据并将其保存到磁盘。
如何更简单、更高效地索引和存储 Linux 上文件的元数据?
我研究过看起来很有希望的 git-annex,并且我看到人们使用 updatedb 来跟踪文件(还有 metdadata?)但也许有人有更好的选择?
答案1
对于关键服务器,请使用备份整个机器的解决方案,而不仅仅是复制文件。这样元数据和所有相关配置都会被保存。
如果是虚拟机,某些软件只会复制整个虚拟机管理程序数据文件。
答案2
答案3
您可以使用系统完整性工具(例如tripwire
、AIDE
等)来存储文件的校验和和元数据。这些工具旨在检测文件元数据和内容的更改,因此它们会创建此信息的索引。