引用逃脱与 grep 和 sed 的斗争

引用逃脱与 grep 和 sed 的斗争

我正在编写一个 bash 脚本来从 html 标签中提取数据,我在另一个线程中发现了这个命令:grep -o '<tr>.*</tr>' HTMLFILE | sed 's/\(<tr>\|<\/tr>\)//g' > NEWFILE,它运行得很好。

但知道我想从标签中的链接中提取名称<a>,例如<a href="www.mywebsite.com?name="What_I_Want_To_Extract">.我苦苦思索,但没能适应下面的命令,有什么帮助吗?

答案1

grep -oP 'name="\K[^"]*' filename

输出:

What_I_Want_To_Extract

看:http://www.charlestonsw.com/perl-regular-expression-k-trick/

您的版本已调整:

grep -o 'name=".*">' HTMLFILE | sed 's/name="\|">//g' NEWFILE

相关内容