文件系统压缩对于 CouchDB 存储来说是一个好主意吗?

文件系统压缩对于 CouchDB 存储来说是一个好主意吗?

我在 Amazon EC2 上托管 CouchDB 数据库,我想知道如果我使用支持压缩的文件系统,我是否可以获得更好的 I/O 性能(当然还有更好的磁盘利用率)。我记得在某处读到过,CouchDB 的未来版本将支持数据压缩,我想知道如果我只压缩文件系统,我现在是否可以获得该功能。我正在考虑使用小型实例,但大型实例也不是不可能的。我担心压缩会杀死这些实例上的 CPU,但我只有在测试后才能知道。

我听起来是不是太疯狂了?有人已经尝试过了?

答案1

我还没有根据 KISS 原则尝试过这一点,但我认为你会看到性能有所提升。

CouchDB 将使用 Google 的快速压缩算法。Filipe Manana 在问题跟踪器中介绍了该功能,COUCHDB-1120,并已将其提交到“trunk”(自 Git 迁移以来,现在是“master”分支)。它位于 1.2.x 分支中,因此当您看到 CouchDB 1.2 已发布时,您就会知道它已发货。

与此同时,是的,CouchDB 基本上只是 B 树查找。即使是 Javascript “查询”(它们更像是索引定义)也只在每次文档更新时运行一次。作为数据库,CouchDB 需要良好的存储,并且您可能会过度配置 CPU 以满足您的存储需求。因此,通过在压缩上花费更多 CPU,您可能会看到性能提升,或者最坏的情况下没有净变化,这似乎是合理的。

如果你制作基准测试,我相信 CouchDB 社区会很乐意看到它们!请随意将其发送到用户列表或者只是发推文提及 CouchDB。祝你好运!

相关内容