我有一个 XML 文档,如下所示:
A 列至 S 列带有标题,共有 1922 行。
这是一些短信的备份,我想删除重复的短信。
问题是,readable_date 标头中的时间被搞乱了。日期没有问题,但时钟时间错误,所以我将该列分成三列,分别为年份、日期和时钟。
我知道我可以使用标准过滤器,但它只会在单个列中查找唯一行。我想要执行的是进行类似这样的行检查:
F(x)=检查第 2A 列到 (infinate) 是否等于第 3A 列到 (infinate),但忽略列 (R)。如果为真,则删除第 3A 列到 (infinate),否则检查第 2A 列到 (infinate) 是否等于第 4A 列到 (infinate),依此类推。
我每次都需要忽略一行中的特定列,并且需要对整张表执行此操作。当第一行完成重复检查后,公式检查应适用于每一行...
如果其他人有更好的解决方案,请说出来。无论如何,有人可以帮忙吗?
您说得对,我通常可以这样做,但对于非常短的消息,这并不适用,因为“嘿”消息可以由多个人发送,也可以由一个人在多天发送,并且这不是重复的。
第一次尝试时需要完整检查行,并忽略某一列,否则会返回假阳性或假阴性......
答案1
我对数据库不是很了解,但如果你在 excel 中打开文件,你可以选择所有列,然后按 az 排序,在包含实际消息的列中排序,然后在排序后删除重复项,然后向下扫描该列。当然你想要一个公式,但我只是想知道这是否比试图找出公式更快哈哈。如果我没有帮上忙,我很抱歉。