一个 ColumnFamily 只将数据放置在 4 个节点中的 3 个上

Question 1

简单策略意味着 Cassandra 不考虑机架、数据中心或其他地理位置来分发数据。这是了解数据分布的重要信息，但不足以全面分析您的情况。

如果你想了解行在集群中的分布情况，这也是一个问题分区器您使用的。随机分区器在决定应该拥有行键的集群成员之前会对其进行哈希处理。保序分区器则不会这样做，这可能会在集群上创建热点（包括完全不使用节点！），即使您的节点对环进行了相等的划分。您可以在其中一个节点上使用以下命令试验 Cassandra 如何分配不同的密钥，以查看 Cassandra 认为不同的密钥（实际或假设）属于哪些节点：

nodetool -h localhost getendpoints <keyspace> <cf> <key>

如果其他列族在集群中正确地分布其数据，我会研究您使用的分区器和键。

Answer

简单策略意味着 Cassandra 不考虑机架、数据中心或其他地理位置来分发数据。这是了解数据分布的重要信息，但不足以全面分析您的情况。

如果你想了解行在集群中的分布情况，这也是一个问题分区器您使用的。随机分区器在决定应该拥有行键的集群成员之前会对其进行哈希处理。保序分区器则不会这样做，这可能会在集群上创建热点（包括完全不使用节点！），即使您的节点对环进行了相等的划分。您可以在其中一个节点上使用以下命令试验 Cassandra 如何分配不同的密钥，以查看 Cassandra 认为不同的密钥（实际或假设）属于哪些节点：

nodetool -h localhost getendpoints <keyspace> <cf> <key>

如果其他列族在集群中正确地分布其数据，我会研究您使用的分区器和键。

Question 2

结果是模式问题——我们本来拥有多行（每个用户 1 行），但却拥有一行包含超过 800,000 列的巨大行。

我怀疑发生的事情是：

此行始终被操作系统缓存 - 因此我们没有看到任何 IO
然后 Cassandra 占用了所有的 CPU 时间一遍又一遍地序列化大量的行，以获取其中的数据

我们已经改变了应用程序的执行方式，即它为单个用户的详细信息存储单行，问题就消失了。

Answer

结果是模式问题——我们本来拥有多行（每个用户 1 行），但却拥有一行包含超过 800,000 列的巨大行。

我怀疑发生的事情是：

此行始终被操作系统缓存 - 因此我们没有看到任何 IO
然后 Cassandra 占用了所有的 CPU 时间一遍又一遍地序列化大量的行，以获取其中的数据

我们已经改变了应用程序的执行方式，即它为单个用户的详细信息存储单行，问题就消失了。

一个 ColumnFamily 只将数据放置在 4 个节点中的 3 个上

答案1

答案2

相关内容