我有两个单词列表,每行一个,每个列表都在一个单独的文件中,我需要做两件事:
- 合并两个列表但排除重复项。
- 删除所有长度少于 5 个字符的单词。
例如:第一个列表:
apple
banana
orange
第二份名单:
apricot
avocado
lime
合并列表:
apple
banana
orange
apricot
avocado
如何使用 Notepad++ 完成此任务?
答案1
合并:
合并两个文件最简单的方法是复制和粘贴。Notepad++ 没有内置文件合并功能。
不过,你可以安装一个插件来实现这一点。请参阅在 Notepad++ 中合并文件。
另一个解决方案是使用命令行copy
。请参阅需要将大量文件合并到一个目录中
替换换行符:
删除重复项比删除短单词更棘手,因为 Notepad++ 的搜索不会一次搜索多行,所以我们必须将换行符转换为其他内容。
为了实现这一点,您可以执行扩展替换,查找所有\r\n
(DOS 换行符)并用#
(或列表中未出现的任何其他字符)替换它们。
如果最后一行不是空白,则将 a 附加#
到结果字符串的末尾。
删除重复项:
现在执行正则表达式替换,查找全部([^#]+)#(.*#)\1#
并用 替换它们\1#\2
。
如果单个文件中有重复项,您可能需要多次执行此操作。
删除 4 个或更少字符的单词:
这个很简单。只需执行正则表达式替换,找到所有内容#.?.?.?.?#
并将其替换为#
。
换行符:
现在您可以摆脱换行符的困扰。只需执行扩展替换,找到所有内容#
并将其替换为\r\n
。
最后,删除最后一行,因为它将是空白的。