尝试使用 Couchdb River 插件将约 4 亿个文档从 Couchdb 导入 Elasticsearch。一开始一切都很顺利,索引时间约为 5k/s,但几个小时后发现它的速度降到了 20/s 左右。我们的系统位于一个强大的盒子上,x1.xlarge,它所做的就是 Elasticsearch。我们有一个 20 个没有复制的分片来帮助索引和禁用索引刷新。堆设置为使用 65% 的内存,我们正在使用 Oracle 的最新版本 Java 7。
我需要调整哪些设置来帮助初始数据导入?我已经尝试过 bluk 超时/大小,但仍然找不到最佳点。
任何帮助都非常感谢。Zuhaib