删除所有有重复的字符串

删除所有有重复的字符串

我并不是想只删除重复的字符串。这会导致在删除所有重复项后只留下一个有问题的字符串实例。相反,如果发现重复项,则删除所有实例(包括原始实例),这样该字符串就根本不存在了。例如,对于源文件

Huey
Huey
Louie
Huey
Dewey
Donald
Uncle Scrooge 
Donald
Daffy

这样的脚本将导致

Louie 
Dewey 
Uncle Scrooge  
Daffy

请注意,此示例并不表示数据的样子,它只是对我想要应用于重复文本的逻辑的说明。我正在使用 Notepad++。

答案1

您可以根据自己的情况使用 SQL 插件。

要安装它,首先需要安装 PluginManager。请访问此链接:https://github.com/bruderstein/nppPluginManager/releases。选择适合您的 N++ 的版本并下载。解压后 ,

其结构如下。PluginManager_v1.4.11_x64     |---plugins         |---PluginManager.dll     |-​​--updater         |---gpup.exe 为了撰写本文,我下载了 N++ 的 zip 64 位版本。解压后,它已包含插件和更新程序文件夹。我只是将文件从 PluginManager 复制到 N++ 文件夹。 让我们开始 N++









在此处输入图片描述

让我们安装 SQL 插件。 在此处输入图片描述

下一步是将数据放入 N++。SQL 插件需要列名。可以选择任何名称。我简单地选择了“MyColumn”。它还需要列的分隔符。我使用了正则表达式。在替换窗口 (Ctrl+H) 中:
查找内容:\r\n|$
替换为:,\r\n


现在每一行都有一个列名和分隔符。
在此处输入图片描述

最后运行 SQL 插件。SQL
语句:从数据中选择 MyColumn GROUP BY MyColumn HAVING COUNT(MyColumn) = 1
分隔符:,

在此处输入图片描述

在输出中我们得到了预期的结果。
在此处输入图片描述

相关内容