获取浏览器标题

Question

我建议使用真正理解 HTML 的程序，而不是尝试使用 perl 自己解析它。一个问题是您的 perl 脚本仅解析任何标题标签的第一个实例，这对于管道命令来说并不理想。

下面我正在使用小狗解析网页中的 HTML，找到所有标题标签，然后打印其内容。自然地将 10 和 20 替换为您想要的范围。

wget -qO - https://twitter.com/{10..20} | pup 'title text{}'

结果输出

Tweets med svar fra edo (@10) | Twitter
Tweets med svar fra Stephen (@11) | Twitter
Twitter / Konto suspendert
13 (@13) | Twitter
Hazem Emam (@14) | Twitter
Tweets med svar fra 愛と平和の伝道師 (@15) | Twitter
@16 (@16) | Twitter
Sonja Cruz (@17) | Twitter
Twitter / Konto suspendert
One God (@19) | Twitter
Twitter / Konto suspendert

Answer 1

我建议使用真正理解 HTML 的程序，而不是尝试使用 perl 自己解析它。一个问题是您的 perl 脚本仅解析任何标题标签的第一个实例，这对于管道命令来说并不理想。

下面我正在使用小狗解析网页中的 HTML，找到所有标题标签，然后打印其内容。自然地将 10 和 20 替换为您想要的范围。

wget -qO - https://twitter.com/{10..20} | pup 'title text{}'

结果输出

Tweets med svar fra edo (@10) | Twitter
Tweets med svar fra Stephen (@11) | Twitter
Twitter / Konto suspendert
13 (@13) | Twitter
Hazem Emam (@14) | Twitter
Tweets med svar fra 愛と平和の伝道師 (@15) | Twitter
@16 (@16) | Twitter
Sonja Cruz (@17) | Twitter
Twitter / Konto suspendert
One God (@19) | Twitter
Twitter / Konto suspendert

获取浏览器标题

答案1

相关内容