解释起来很困难,我想从例子开始。请参阅粗体文字。
我有很长的清单,如下所示:
http://dl3/film/**Daylights.End**.3*******************
http://dl45/film/**The.Wild.Life**.720***************
http://dl45/film/**The.Wild.Life**.10***************
http://dl3.pw/film/T**he.Wild.Life**.2*******************
http://dl45/film/**Daylights.End**.2*******************
我想找到之后包含相同字符串的所有重复行/film/
,但我不想搜索该行到最后,搜索应该查找重复的字符串,就像之后的 10 或 20 个字符一样/film/
- 后面的字符串
/film/
不同。 - 该方法应该搜索大约 5000 行的列表并找到所有重复行,并且可能在创建后删除、剪切、复制或标记其中的一两个。
提前致谢
答案1
尝试
sed -n 's/^/@/' > newfile
或者
sed -ni 's/^/@/'
@
这两个命令都会在最后一个命令的每个 libe 的开头插入一个。
答案2
很好,命令输出
cat long-list |grep -Eo '/film/.{15}' |sort |uniq --repeated
是一个包含所有重复名称的列表。现在我怎样才能在起始行中用@之类的东西标记所有重复的行?