我正在尝试编写一个 shell 脚本,该脚本应该爬进网页并从其 html 中获取特定字符/短语并显示它。特定字符意味着,例如,如果网页的 html 包含一个短语,比如说password:blah
,那么我想打印下一个字符/单词password
,即,简而言之,我希望脚本打印blah
。我该怎么做?
如果需要更多解释,请询问。提前致谢!
答案1
您不需要 shell 脚本。您也许需要以下复合命令:
curl -s webpage | grep -Po 'password:\K\w+'
例如这个页面的情况是这样:
curl -s http://askubuntu.com/questions/537416/copy-a-word-from-the-html-file-of-a-web-page-using-shell-script | grep -Po 'password:\K\w+'