删除行首有重复 URL 的行

删除行首有重复 URL 的行

前:

https://en.wikipedia.org/wiki/Led_Zeppelin - Led Zeppelin - Stairway To Heaven 2
https://en.wikipedia.org/wiki/Led_Zeppelin - Led Zeppelin - Stairway To Heaven 1 

https://en.wikipedia.org/wiki/Dire_Straits - Dire Straits - Sultans Of Swing #1 
https://en.wikipedia.org/wiki/Dire_Straits - Dire Straits - Sultans Of Swing #2 

后:

https://en.wikipedia.org/wiki/Led_Zeppelin - Led Zeppelin - Stairway To Heaven 2
https://en.wikipedia.org/wiki/Dire_Straits - Dire Straits - Sultans Of Swing #1 

答案1

此替换对话框将执行所需的操作:

查找内容:(https.+?) (.+?)\r\n\1.*?\r\n
替换为:\1 \2\r\n


在此处输入图片描述


解释:

  • ()- 团体
  • .+?- 任何至少有一个字符的字符串,? 表示非贪婪
  • \1- 第一个匹配的组
  • \r\n- 回车符和换行符,在 Windows 中表示行尾(在 Linux 中则表示\n

请注意,要使其正常工作,URL 的最后一行必须以行尾结束。

参考 : Notepad++ 用户手册

相关内容