我感兴趣的是了解一组 PST 文件的预期最大重复数据删除率是多少。
我有来自约 15 个用户的约 40G pst 文件,附件重复率很高。我正在运行测试,看看如果我将数据存储在具有重复数据删除功能的 ZFS 上,是否可以节省大量空间。
为此,我安装了 Nexenta 的测试设置,但想知道这里是否有人已经这样做了,以及我可能期望什么级别的重复数据删除(或者换句话说,pst 文件对块对齐的敏感程度如何,以及哪些参数可以影响该比率?)。
初步测试显示重复数据删除率非常低,而且我确实发现解释块级重复数据删除在这里效率不高,而字节级重复数据删除会好得多(并且它应该由了解内部组织的应用程序执行),所以我只是在这里仔细检查是否有人有更多的意见。
否则我可能会将 PST 文件转换为 IMAP。
答案1
是的,PST 文件不太可能产生您想要的重复数据删除率。PST 中的附件不会按块对齐,因此无法进行重复数据删除。如果您希望最大限度地利用 ZFS 进行重复数据删除,那么您将需要一种附件为不同文件的存储格式。