比较两个 xls 文件以删除重复的行

比较两个 xls 文件以删除重复的行

我有两个分别为 8MB 和 10MB 的 xls 文件。我必须合并它们并删除重复的行。(两个文件都有唯一的行,但合并后会有重复的行)。

我曾尝试合并这两个文件,但由于文件太大,所以无法合并。

考虑到我的情况,Ubuntu 中是否有任何方法可以删除文件内的重复项?

笔记:- 如果无需合并文件就可以删除重复内容,那么也是可以接受的。

我根据建议进行了尝试:- 我将两个文件都转换为 csv。然后我将一个文件复制到另一个文件,然后使用高级过滤器删除重复项。然后我将新的(组合的)csv 保存为 xls 格式。但是当我重新打开新的(组合的)xls 文件时,它不会显示所有数据。它只显示了 60% 的数据。

新的(组合的)csv 文件为 24MB,当我将其保存为 xls 文件时,xls 文件大小为 11MB

答案1

Libreoffice:数据 → 过滤器 → 高级过滤器 → 选项 → 禁用重复行

您可以将两个文件的内容复制到工作表中,删除重复项并根据需要创建 2 个新文件。这需要在工作表中进行某种标记,以便您可以看到文件 2 已开始。

不需要特殊魔法。

在此处输入图片描述

相关内容