Elasticsearch 索引比它索引的日志的实际大小大得多吗?

Elasticsearch 索引比它索引的日志的实际大小大得多吗?

我注意到 elasticsearch 一夜之间消耗了超过 30GB 的磁盘空间。相比之下,我想要索引的所有日志的总大小只有 5GB...嗯,实际上甚至没有那么多,可能更像是 2.5-3GB。这有什么原因吗?有没有办法重新配置它?我正在运行 ELK 堆栈。

答案1

我猜你有很多字符串内容。默认情况下会分析字符串类型,这意味着每个字符串都会被拆分成标记(根据我的经验,我发现分隔符是“ ”和“-”),并且每个标记都会被索引。

阅读有关字符串类型的更多信息这里

现在您知道应该做什么了。问题是有些工具对如何将信息发送到 elasticsearch 提供的支持很少,因此设置索引属性非常困难,甚至不可能。

相关内容