将具有相似单词的行分组

将具有相似单词的行分组

我有多个包含大量文本数据的文档,我想通过聚类对它们进行分组。对具有多个重复项的行进行分组,例如第 23 行有两个单词 car 和 truck,第 197 行也有 car 和 truck,我想将这两行组合在一起,因为它们有两组重复项。

car truck scooter bike
cat horse duck rat
ship car boat truck

有什么方法可以检测行中的两组或多组重复项,并将这些行分组/排序在一起,以便

car truck scooter bike
ship car boat truck
cat horse duck rat

我对 excel 还是个菜鸟

相关内容