如何使用 sed AWK 提取开始和结束模式之间的字符串？

Question 1

每行以开头<span>和结尾</span>：

sed 's|<span>\(.*\)</span>|\1|' domain.txt

awk您还可以通过将字段分隔符设置为<or>并打印第三列来实现此目的：

awk -F '[<>]' '{print $3}' domain.txt

输出：

aghahan.com
pouyamannequin.com

这些是最简单的方法，如果行尾部有空白，它也可以工作。

Answer

每行以开头<span>和结尾</span>：

sed 's|<span>\(.*\)</span>|\1|' domain.txt

awk您还可以通过将字段分隔符设置为<or>并打印第三列来实现此目的：

awk -F '[<>]' '{print $3}' domain.txt

输出：

aghahan.com
pouyamannequin.com

这些是最简单的方法，如果行尾部有空白，它也可以工作。

Question 2

和sed

 sed 's/\(.*\)>\(.*\)<\(.*\)/\2/g' domain.txt

Answer

和sed

 sed 's/\(.*\)>\(.*\)<\(.*\)/\2/g' domain.txt

Question 3

与python和BeautifulSoup：

python -c '
from bs4 import BeautifulSoup
f = open("domain.txt", "r")
soup = BeautifulSoup(f.read(),"html.parser")
for span in soup.find_all("span"):
  print(span.string)
'

对于您的简单任务来说可能有点大材小用，但在更困难的任务上会工作得更好并且更容易，例如，如果您有不同的 html，例如：

<span>
 aghahan.com
</span>
<span>
 pouyamannequin.com
</span>

Answer

与python和BeautifulSoup：

python -c '
from bs4 import BeautifulSoup
f = open("domain.txt", "r")
soup = BeautifulSoup(f.read(),"html.parser")
for span in soup.find_all("span"):
  print(span.string)
'

对于您的简单任务来说可能有点大材小用，但在更困难的任务上会工作得更好并且更容易，例如，如果您有不同的 html，例如：

<span>
 aghahan.com
</span>
<span>
 pouyamannequin.com
</span>

Question 4

awk -F ">" '{print $2}' filename| sed "s/<.*//g"

输出

aghahan.com
pouyamannequin.com

Answer

awk -F ">" '{print $2}' filename| sed "s/<.*//g"

输出

aghahan.com
pouyamannequin.com

如何使用 sed AWK 提取开始和结束模式之间的字符串？

答案1

答案2

答案3

答案4

相关内容