使用 shell 脚本从网页的 html 文件复制一个单词

使用 shell 脚本从网页的 html 文件复制一个单词

我正在尝试编写一个 shell 脚本,该脚本应该爬进网页并从其 html 中获取特定字符/短语并显示它。特定字符意味着,例如,如果网页的 html 包含一个短语,比如说password:blah,那么我想打印下一个字符/单词password,即,简而言之,我希望脚本打印blah。我该怎么做?

如果需要更多解释,请询问。提前致谢!

答案1

您不需要 shell 脚本。您也许需要以下复合命令:

curl -s webpage | grep -Po 'password:\K\w+'

例如这个页面的情况是这样:

curl -s http://askubuntu.com/questions/537416/copy-a-word-from-the-html-file-of-a-web-page-using-shell-script | grep -Po 'password:\K\w+'

答案2

类似这样的事情应该可以工作:

wget -qO- http://website.com | grep -oP 'password:.*'

男子wget所有选项。wget可以下载整个网站。

相关内容