为了开展一个研究项目,我试图找出患者入院各科室的频率。对于每个科室,我都有一个包含大量数据的 Excel 文件,但已将其精简为两列:患者 ID 和入院日期。每位患者(约 300 名)都入院多次,因此每张表有超过 20,000 行,如下所示:
ID1 23/07/15
ID1 25/08/15
ID1 09/01/16
ID2 14/06/14
ID2 12/08/15
只不过每个病人的约会次数远不止两三个。
现在我显然不想遍历 20,000 行(每个文件,我有 6 行)并手动计算所有内容。我需要一种方法来:
a)删除包含重复日期的整行(由于某种原因,同一个病人经常在两个相邻的行中有两个相同的入院日期)
和
b) 让 Excel 根据第一列中的相同 ID 计算每个患者的日期总数(即行数)。
经过一番尝试后,我找到了突出显示连续重复项的方法(使用条件格式),但我无法让 Excel 为我删除整行,或者进行计数。
有没有办法在 Excel 中实现这一点,还是我必须手动完成?