备份 Elasticsearch 中的旧索引

Question

像我们所做的那样，在客户端机器上运行策展人工作可以吗？

是的，因为“客户端”机器除了向您的 ES 集群发送 REST 请求并等待响应之外没有执行任何操作。

从一台机器上获取所有索引的快照可以吗？

再次，是的。原因与第一个问题相同。

由于日志被不断推送，在创建快照并推送到 Amazon S3 时是否会导致集群不稳定？

Snapshotting process is executed in non-blocking fashion. All indexing and searching 
operation can continue to be executed against the index that is being snapshotted.

索引速度可能会略有减慢，但根据您的机器规格，我认为它可能会没问题，但除非您尝试，否则真的没有办法知道。快照速度的限制因素可能是共享文件系统存储库的磁盘，以及 S3 存储库的 Internet 连接速度。

关于使用 S3 存储库以及这会如何影响流程，文档关于 S3 存储库插件的实际工作原理，我怀疑每个持有主分片的数据节点都会将其分片推送到存储库（S3 或其他）。这意味着在对 S3 存储库执行快照时，ES 集群上的负载可能不会比对共享文件系统存储库的负载更大。
再次，测试因为每个环境都是独一无二的，对一个人有用的方法不一定对另一个人有用。

人们通常遵循哪些最佳做法来备份 Elasticsearch 的旧索引？

我发现 ES 有相当好的文档，其中有一节关于快照和还原。实际上，那里面并没有太多关于“最佳”实践的内容，所以除非你在网上遇到其他资源，否则我会说你最好的选择是开始尝试，看看什么对你有用。

Answer 1