我有多个包含大量文本数据的文档,我想通过聚类对它们进行分组。对具有多个重复项的行进行分组,例如第 23 行有两个单词 car 和 truck,第 197 行也有 car 和 truck,我想将这两行组合在一起,因为它们有两组重复项。
car truck scooter bike
cat horse duck rat
ship car boat truck
有什么方法可以检测行中的两组或多组重复项,并将这些行分组/排序在一起,以便
car truck scooter bike
ship car boat truck
cat horse duck rat
我对 excel 还是个菜鸟