如何从很长的短语列表中删除重复的短语?

如何从很长的短语列表中删除重复的短语?

我有一台运行 Mountain Lion 的新 iMac,我正在使用 Word 2008。我已经整理了我的列表,它有一百多页长,有很多重复的短语。每个短语都在单独的行上,每行都以硬回车结束。我尝试在“查找和替换”对话框中的“查找内容:”字段中输入 ^([^\n]+)\n\1,希望它能找到并删除所有重复的短语,但我收到一条错误消息,提示“^( 不是“查找内容”框的有效特殊字符”。任何帮助都将不胜感激。听起来我要做的事情相对简单。是吗?——Pat

答案1

选项1

我假设,既然你有 Word,你也有Excel如果是那样的话,你可以用Excel来实现你想要的:

  • 将短语列表从 Word 复制粘贴到 Excel 电子表格中。

  • 关注此简短指南使用过滤器隔离独特的短语。

  • 突出显示 Excel 中生成的短语列表并将其复制粘贴回 Word 文档中。

选项 2

如果您的信息不属于“敏感信息”,您可以使用如下在线工具:

http://www.textfixer.com/tools/remove-duplicate-lines.php

:-) 米

答案2

我不确定如何在 Word 中执行此操作,但通过命令行执行此操作很容易:

sort -u < phrases.txt > phrases-sorted-unique.txt

或者如果重复的短语已经在连续的行上,则只需:

uniq < phrases.txt > phrases-unique.txt

相关内容