我有两个分别为 8MB 和 10MB 的 xls 文件。我必须合并它们并删除重复的行。(两个文件都有唯一的行,但合并后会有重复的行)。
我曾尝试合并这两个文件,但由于文件太大,所以无法合并。
考虑到我的情况,Ubuntu 中是否有任何方法可以删除文件内的重复项?
笔记:- 如果无需合并文件就可以删除重复内容,那么也是可以接受的。
我根据建议进行了尝试:- 我将两个文件都转换为 csv。然后我将一个文件复制到另一个文件,然后使用高级过滤器删除重复项。然后我将新的(组合的)csv 保存为 xls 格式。但是当我重新打开新的(组合的)xls 文件时,它不会显示所有数据。它只显示了 60% 的数据。
新的(组合的)csv 文件为 24MB,当我将其保存为 xls 文件时,xls 文件大小为 11MB