Excel 或 SPSS 中所有可能的列组合的交叉表

Question

我会用来做这件事COUNTIFS。

首先，为表格标题行和列创建标题，这相当简单，特别是如果变量按示例编号（Boolean1、Boolean2、...），因为您只使用自动填充。否则，您必须进行一些字符串操作/提取才能获得漂亮的表格：

             |   Boolean2        Boolean2 |    Boolean3       Boolean3 |
             |         No             Yes |         No             Yes |
-----------------------------------------------------------------------|
Boolean1 No  |          X                 |                            |
Boolean1 Yes |                            |                            |
-----------------------------------------------------------------------|
Boolean4 No  |                            |                            |
Boolean4 Yes |                            |                            |

您还必须将数据集定义为带有标题行的 Excel 表（Ctrl-L）（我使用 Table1 作为默认名称）。

在 X（假设是单元格 C3）中输入公式：
=COUNTIFS(INDIRECT("Table1["& C$1 &"]");C$2;(INDIRECT("Table1["& $A3 &"]"));$B3)
当然，您可以自动填充整个区域。

指Table1[Boolean2]的是数据集中的该列（INDIRECT只是避免了您必须对列引用进行硬编码，并且可以使用单元格中的值C1）。因此，总体公式计算Table1[Boolean2]为“否”和Table1[Boolean1]也为“否”的实例（使用中的两个条件COUNTIFS）。

输出将完全对称，因此根据您想要计算 Jaccard 指数的方式，您只需取对角线下方的输出（丢弃重复的 (N,M) 和 (M,N) 以及平凡的 (N,N)）。如果您想要立即获得干净的输出，当然可以添加一个附加项，IF以便仅当行中的变量索引大于列中的变量索引时才计算数字。您可能也可以在相同的公式中执行此操作，但为了可见性，我只需添加一个带有变量索引号（从 1 到 29）的额外行和列，然后对其进行测试。

Answer 1