如何查看重复的行(复制/粘贴部分文本)在同一个文件中?我有一个文件,里面有很多复制/粘贴的部分。有时,只有几行。有时,只有一行,但在末尾或开头有多余的字符。
我搜索过,但无济于事:有一些工具可以提高开发人员的代码质量,这些工具可以检查文件之间的相似代码部分。但在这种情况下,它位于同一个文件。
它需要有一个界面来轻松查看和编辑/删除线条。
你有什么主意吗?
答案1
如果行首和/或行末有多余的字符,则应先将其删除。
对于简单的线条,使用 uniq 命令,其中您感兴趣的选项有:
-d, --repeated
only print duplicate lines, one for each group
-D print all duplicate lines
--all-repeated[=METHOD]
like -D, but allow separating groups with an empty line;
METHOD={none(default),prepend,separate}
使用示例:
uniq -D file
更多技巧,请参阅文章 查找文件中的重复行并计算每行重复的次数?