正则表达式:可以在几个 html 文件上找到重复的 html 链接(字符串)吗?(查找重复项)

正则表达式:可以在几个 html 文件上找到重复的 html 链接(字符串)吗?(查找重复项)

我的 html 页面中有很多元描述,就像这个一样。

<meta name="description" content="My name is prince."/>

<meta name="description" content="O love books."/>

<meta name="description" content="Laptop is my first price."/>

但我想知道<meta 名称="描述"html 文件中重复的标签。这可能吗?

例如,我可以文件-1.html文件-2.html相同的 meta desciption 标签,这是不正确的。这就是为什么我必须找出重复的 html 标签。

因此,我有这个正则表达式来查找重复的行:(^(.*?)$\s+?^(?=.*^\1$) .matches newsline)

我根据我的情况更新了这个正则表达式,如下所示:

^(<meta name="description" content=".*"/>)$\s+?^(?=.*^\1$) (.matches 新闻热线)

但没有作用。

答案1

我找到了解决方案

  • Ctrl+H
  • 找什么:^(<meta name="description" content=".*"/>)$\s+?^(?=.*^\1$)
  • 用。。。来代替:LEAVE EMPTY
  • 检查环绕
  • 检查正则表达式
  • 查看. matches newline
  • Replace all

相关内容