我正在寻找 elasticsearch 概念验证所需的服务器范围。
最终,我的问题是:
假设 elasticsearch 索引了 1GB 的 json 文本,那么预计 elasticsearch 会占用多少磁盘空间?
显然有很多变量,但我要的是数量级。100MB?100GB?
我了解 elasticsearch 执行压缩(http://www.elasticsearch.org/guide/reference/index-modules/store/),但我不知道索引和其他结构占用了什么样的空间。
轶事答案是可以接受的,但也请告诉我您使用的版本。
答案1
答案是:视情况而定。
博客文章Adrien Grand,从事 Elasticsearch 工作从 Lucene 的角度对此进行了一些基准测试。看起来他获得了大约 2 倍的改进。
他还提到LUCENE-4226,其中完成了一些底层压缩工作。其中列出了一些基准,比较了测试的各种压缩算法。
此外,基于此Elasticsearch 0.19.5 发布公告,似乎存储级压缩默认为 LZF,Snappy 将在未来的某个时候推出。进一步查看发现 Snappy 实验性支持出现在 0.19.9 中