我正在编写一个 bash 脚本来从 html 标签中提取数据,我在另一个线程中发现了这个命令:grep -o '<tr>.*</tr>' HTMLFILE | sed 's/\(<tr>\|<\/tr>\)//g' > NEWFILE
,它运行得很好。
但知道我想从标签中的链接中提取名称<a>
,例如<a href="www.mywebsite.com?name="What_I_Want_To_Extract">
.我苦苦思索,但没能适应下面的命令,有什么帮助吗?
答案1
grep -oP 'name="\K[^"]*' filename
输出:
What_I_Want_To_Extract
看:http://www.charlestonsw.com/perl-regular-expression-k-trick/
您的版本已调整:
grep -o 'name=".*">' HTMLFILE | sed 's/name="\|">//g' NEWFILE