使用硬链接进行廉价/快速的重复数据删除?

使用硬链接进行廉价/快速的重复数据删除?

我拥有一个共享主机,上面安装了数千个 Wordpress,我一直想找到一种合理且安全的方式删除所有重复文件。我正在寻找更好的磁盘缓存命中率和更简单的备份。

我只是使用标准 Ext4,而不是像 ZFS 那样内置的(需要付费)。

我熟悉 rdfind 等工具几乎完美。它可以扫描所有文件,找到重复项并将它们硬链接在一起。我可以在非高峰时段每周按计划运行它,从而使成本几乎为零。

问题是我希望单个帐户更改文件以破坏硬链接并再次提供其自己的文件副本。这样,一个网站更新 Wordpress 或插件就不会干扰任何其他网站。这也可以消除潜在的安全问题,因为没有帐户能够篡改另一个帐户的文件。有点像链接的写入时复制。

有可能出现这样的情况吗?我尝试搜索,但什么也没找到。

答案1

看起来,高效的“离线”重复数据删除的最佳解决方案是 BTRFS reflinks。

如果有人试图更改文件(例如 Wordpress 更新),那么链接将保持“可破坏”,从而维护平台的安全性和易用性。

感谢 @bitinerant 指出这个选项。我将进行进一步的实验,看看它是否值得在我的特定场景中迁移。我可以将 EXT4 迁移到 Btrfs,这使得它比 ZFS 或类似系统更可行。

相关内容