列出文件中所有的html标签

Question 1

Perl 的快速破解：

perl -wlne 'print for(/<.*?>/g)' file.html

但对于一个严肃的解决方案，您应该使用真正理解 html/xml 的工具。

Answer

Perl 的快速破解：

perl -wlne 'print for(/<.*?>/g)' file.html

但对于一个严肃的解决方案，您应该使用真正理解 html/xml 的工具。

Question 2

使用实际的 html 解析器并不难：

perl -MHTML::Parser -E '
  $handler = sub {say "<".shift.">"};
  HTML::Parser->new(start_h => [$handler,"tag"], end_h => [$handler,"tag"])
              ->parse_file(shift @ARGV)
' file.html

<html>
<head>
<title>
</title>
</head>
<body>
</body>
</html>

Answer

使用实际的 html 解析器并不难：

perl -MHTML::Parser -E '
  $handler = sub {say "<".shift.">"};
  HTML::Parser->new(start_h => [$handler,"tag"], end_h => [$handler,"tag"])
              ->parse_file(shift @ARGV)
' file.html

<html>
<head>
<title>
</title>
</head>
<body>
</body>
</html>

列出文件中所有的html标签

答案1

答案2

相关内容