我要用什么最佳方式来搜索和删除超过 50GB 的文本文件中的重复项并将它们合并为一个?我认为 GUI 应用程序会挂起,因此我需要一种支持线程的 CLI 样式或一种使用 Linux 的方法。
答案1
答案2
Auslogics 重复文件查找器是免费的,处理 50GB 的文本文件应该没有问题。请确保直接从网站下载,以避免使用 CNET 下载器,并且不要接受 Auslogics 工具栏。它相当直观,并且很容易摆脱重复项。
要在 Windows 中连接文本文件,您可以以管理员身份在 cmd 窗口中尝试以下操作:
复制 *.txt bigfile.txt
这会将所有文本文件复制到一个大文件中。不知道这是否适用于您拥有的文件量。