引用逃脱与 grep 和 sed 的斗争

2024-5-21 • tag-icon

我正在编写一个 bash 脚本来从 html 标签中提取数据，我在另一个线程中发现了这个命令：grep -o '<tr>.*</tr>' HTMLFILE | sed 's/\(<tr>\|<\/tr>\)//g' > NEWFILE，它运行得很好。

但知道我想从标签中的链接中提取名称<a>，例如<a href="www.mywebsite.com?name="What_I_Want_To_Extract">.我苦苦思索，但没能适应下面的命令，有什么帮助吗？

grep -oP 'name="\K[^"]*' filename

输出：

What_I_Want_To_Extract

您的版本已调整：

grep -o 'name=".*">' HTMLFILE | sed 's/name="\|">//g' NEWFILE

相关内容