我们如何使用 AWK 提取 nginx 服务器块?输入
server { # php/fastcgi
listen 80;
server_name domain1.com www.domain1.com;
access_log logs/domain1.access.log main;
root html;
location ~ \.php$ {
fastcgi_pass 127.0.0.1:1025;
}
}
server { # simple reverse-proxy
listen 80;
server_name domain2.com www.domain2.com;
access_log logs/domain2.access.log main;
# serve static files
location ~ ^/(images|javascript|js|css|flash|media|static)/ {
root /var/www/virtual/big.server.com/htdocs;
expires 30d;
}
# pass requests for dynamic content to rails/turbogears/zope, et al
location / {
proxy_pass http://127.0.0.1:8080;
}
}
我们如何匹配所需的值并为每个 server{} 块打印一行?
例如
我需要获取listen|root|server_name 的值。所需的输出是
80 domain1.com www.domain1.com html
80 domain2.com www.domain2.com /var/www/virtual/big.server.com/htdocs
答案1
由于每行可以有多个空格分隔值,因此使用起来awk
有点棘手。在 awk 中这绝对是可能的,但使用 Perl 之类的东西更简单:
$ perl -lne '
if(/(^| )server / || eof){
print join " ",@ll if $ll[0];
@ll=();
}
/^(listen|root|server_name)\s+(\S[^;]+)/ && push @ll,$2' file
80 domain1.com www.domain1.com html
80 domain2.com www.domain2.com /var/www/virtual/big.server.com/htdocs
这-lne
意味着“逐行读取输入文件 ( ),去除尾随换行符并向每个调用-n
添加换行符( ) 并在每行上运行由 给出的脚本”。print
-l
-e
代码:
if(/(^| )server / || eof){
server
:如果当前行包含由空格包围或位于行开头的单词,则将运行此部分。print join " ",@ll if $ll[0];
:如果当前数组中存储了任何内容@ll
(因此,如果定义了数组的第一个元素 ,$ll[0]
),则打印以空格连接的数组内容。@ll=();
:清空数组,以便我们可以获得下一个服务器的信息。/^(listen|root|server_name)\s+(\S[^;]+)/ && push @ll,$2'
:如果此行以一个关键字开头,然后有一个或多个空白字符,则找到第一个非空白字符和;
尽可能多的非字符,直到行尾并添加此字符(括号将捕获模式所以“this”现在是$2
) 到数组@ll
进行打印。
这是在 awk 中执行此操作的一种(丑陋的)方法:
$ awk '
(/ server\s*\{/){
if(out){
print out
}
out=""
}
($1=="listen" || $1=="root" || $1=="server_name"){
gsub(";","");
$1="";
gsub(/^ */,"");
out ? out=out" "$0 : out=$0
}
END{print out}' file
80 domain1.com www.domain1.com html
80 domain2.com www.domain2.com /var/www/virtual/big.server.com/htdocs
答案2
每当你的输入数据中有标签(又名名称又名键)到值对时,我发现最好首先创建一个下面的映射数组(f[]
),然后你可以在任何条件下以任何顺序打印你想要的任何值您只需通过标签访问数组值即可。
例如,使用任何 POSIX awk:
$ cat tst.awk
(NR > 1) && ($1 == "server") { prt() }
{
tag = $1
sub(/[[:space:]]*[^[:space:]]+[[:space:]]+/,"")
sub(/;$/,"")
f[tag] = $0
}
END { prt() }
function prt() {
print f["listen"], f["server_name"], f["root"]
delete f
}
$ awk -f tst.awk file
80 domain1.com www.domain1.com html
80 domain2.com www.domain2.com /var/www/virtual/big.server.com/htdocs
如果您遇到不支持字符类的非 POSIX awk,那么只需替换[:space:]
为\t
(即一个空白字符,然后是反斜杠t
)。
有一些更简短的方法可以获取特定问题的输出,但上述方法使您可以灵活地打印、测试、重新排序、修改等这些以及您想要执行的任何其他字段。