我们的集群在运行修复或大量删除时出现超时性能问题。我收到的建议之一是将 casssandra 版本从 2.0.17 更新到 2.2。我正在排空其中一个节点以开始升级,排空工作已经运行了两天。在日志中,偶尔只会看到类似这样的日志:
INFO [ScheduledTasks:1] 2016-04-06 08:17:10,987 ColumnFamilyStore.java (line 808) Enqueuing flush of Memtable-sstable_activity@1382334976(15653/226669 serialized/live bytes, 6023 ops)
INFO [FlushWriter:1468] 2016-04-06 08:17:10,988 Memtable.java (line 362) Writing Memtable-sstable_activity@1382334976(15653/226669 serialized/live bytes, 6023 ops)
INFO [ScheduledTasks:1] 2016-04-06 08:17:11,004 ColumnFamilyStore.java (line 808) Enqueuing flush of Memtable-compaction_history@1425848386(1599/15990 serialized/live bytes, 51 ops)
INFO [FlushWriter:1468] 2016-04-06 08:17:11,012 Memtable.java (line 402) Completed flushing /var/lib/cassandra/data/system/sstable_activity/system-sstable_activity-jb-4826-Data.db (6348 bytes) for commitlog position ReplayPosition(segmentId=1458540068021, position=1198022)
INFO [FlushWriter:1468] 2016-04-06 08:17:11,012 Memtable.java (line 362) Writing Memtable-compaction_history@1425848386(1599/15990 serialized/live bytes, 51 ops)
INFO [FlushWriter:1468] 2016-04-06 08:17:11,039 Memtable.java (line 402) Completed flushing /var/lib/cassandra/data/system/compaction_history/system-compaction_history-jb-3491-Data.db (730 bytes) for commitlog position ReplayPosition(segmentId=1458540068021, position=1202850)
我应该等待还是只是停止节点并开始迁移?
答案1
问题与 2.1 之前版本的错误有关(https://issues.apache.org/jira/browse/CASSANDRA-5911)。刷新后,提交日志不会被删除。
答案2
检查是否有任何其他 nodetool 进程正在运行。当有快照进程备份时,drain 会挂起。我停止了所有进程并重新启动了 Cassandra 以确保其正常运行,然后 drip 就可以正常工作了。