Elasticsearch 集群配置

Question

我的集群配置是否存在什么可疑之处，或者有什么建议可以改进这个过程？

我认为在主节点上运行 Logstash，这样它可以更好地利用其拥有的资源（RAM），而数据节点则主要负责在 ES 中进行索引。

您可能首先会受到 CPU 限制，但根据数据节点上磁盘的速度和类型，我可能错了。您提到您write data to an external HD。如果它是通过 USB 连接的，它可能无法处理索引所有文档所需的高 IO 速率。

如果我在每个数据节点上运行一个 Logstash 实例并索引单独的文件，这会有帮助吗？

我不这么认为。你没有在 Logstash 中做很多工作（没有摸索，只有基本的变异），所以你最终会受到数据节点速度的限制，要求它们做比它们已经做的更多的事情很可能不会有帮助。

至于其他指针，也许可以尝试将分片数量减少到 3 个，并且不设置任何副本，因为这样可以稍微加快速度。索引完成后，您可以随时重新配置索引以设置副本。

最后，您应该在索引时观察系统的资源监视器，以了解哪些资源的负担最重（CPU、RAM、磁盘、网络？），努力解决瓶颈并重复，直到您对索引性能满意为止。

Answer 1

我的集群配置是否存在什么可疑之处，或者有什么建议可以改进这个过程？

我认为在主节点上运行 Logstash，这样它可以更好地利用其拥有的资源（RAM），而数据节点则主要负责在 ES 中进行索引。

您可能首先会受到 CPU 限制，但根据数据节点上磁盘的速度和类型，我可能错了。您提到您write data to an external HD。如果它是通过 USB 连接的，它可能无法处理索引所有文档所需的高 IO 速率。

如果我在每个数据节点上运行一个 Logstash 实例并索引单独的文件，这会有帮助吗？

我不这么认为。你没有在 Logstash 中做很多工作（没有摸索，只有基本的变异），所以你最终会受到数据节点速度的限制，要求它们做比它们已经做的更多的事情很可能不会有帮助。

至于其他指针，也许可以尝试将分片数量减少到 3 个，并且不设置任何副本，因为这样可以稍微加快速度。索引完成后，您可以随时重新配置索引以设置副本。

最后，您应该在索引时观察系统的资源监视器，以了解哪些资源的负担最重（CPU、RAM、磁盘、网络？），努力解决瓶颈并重复，直到您对索引性能满意为止。

相关内容