/film/ 之后包含相同字符串的重复行

/film/ 之后包含相同字符串的重复行

解释起来很困难,我想从例子开始。请参阅粗体文字。

我有很长的清单,如下所示:

http://dl3/film/**Daylights.End**.3*******************
http://dl45/film/**The.Wild.Life**.720***************
http://dl45/film/**The.Wild.Life**.10***************
http://dl3.pw/film/T**he.Wild.Life**.2*******************
http://dl45/film/**Daylights.End**.2*******************

我想找到之后包含相同字符串的所有重复行/film/,但我不想搜索该行到最后,搜索应该查找重复的字符串,就像之后的 10 或 20 个字符一样/film/

  • 后面的字符串/film/不同。
  • 该方法应该搜索大约 5000 行的列表并找到所有重复行,并且可能在创建后删除、剪切、复制或标记其中的一两个。

提前致谢

答案1

尝试

sed -n 's/^/@/' > newfile

或者

sed -ni 's/^/@/'

@这两个命令都会在最后一个命令的每个 libe 的开头插入一个。

答案2

很好,命令输出

cat long-list |grep -Eo '/film/.{15}' |sort |uniq --repeated

是一个包含所有重复名称的列表。现在我怎样才能在起始行中用@之类的东西标记所有重复的行?

相关内容