查找并替换文本字符串之前的所有内容

Question 1

与单awk命令：

awk '{ print $2 > "domains.txt"; print "http://"$3 > "domains_http.txt" }' file

结果：

> cat domains_http.txt 
http://www.at.ask.com
http://www.maps.googleapis.com
http://www.litscape.com
http://www.loc.gov
http://www.mbu.edu

> cat domains.txt 
at.ask.com
maps.googleapis.com
litscape.com
loc.gov
mbu.edu

Answer

与单awk命令：

awk '{ print $2 > "domains.txt"; print "http://"$3 > "domains_http.txt" }' file

结果：

> cat domains_http.txt 
http://www.at.ask.com
http://www.maps.googleapis.com
http://www.litscape.com
http://www.loc.gov
http://www.mbu.edu

> cat domains.txt 
at.ask.com
maps.googleapis.com
litscape.com
loc.gov
mbu.edu

Question 2

第二件事是最简单的：

$ cut -d ' ' -f 2 file.in

这使用cut空格作为分隔符并剪切第二列。

有了awk它，这两项任务就可以轻松完成：

$ awk '{ print $2 }' file.in

这与命令的作用基本相同cut。

$ awk '{ print "http://" $3 }' file.in

这需要第三列并http://在输出之前添加到它前面。

Answer

第二件事是最简单的：

$ cut -d ' ' -f 2 file.in

这使用cut空格作为分隔符并剪切第二列。

有了awk它，这两项任务就可以轻松完成：

$ awk '{ print $2 }' file.in

这与命令的作用基本相同cut。

$ awk '{ print "http://" $3 }' file.in

这需要第三列并http://在输出之前添加到它前面。

Question 3

使用 sed：

sed 's#.*\(www.*\)#http://\1#' source_file > dest_file1
sed 's#.*www\.\(.*\)#\1#' dest_file1 > dest_file2

解释：

对于第一个要求，开始对中的所有内容进行分组www，并将不属于该组的所有内容替换为http://。第二个文件也类似，但现在从后面开始分组www.

请注意，如果您想要命令要完成这些工作，您始终可以将它们别名为自定义命令。

Answer

使用 sed：

sed 's#.*\(www.*\)#http://\1#' source_file > dest_file1
sed 's#.*www\.\(.*\)#\1#' dest_file1 > dest_file2

解释：

对于第一个要求，开始对中的所有内容进行分组www，并将不属于该组的所有内容替换为http://。第二个文件也类似，但现在从后面开始分组www.

请注意，如果您想要命令要完成这些工作，您始终可以将它们别名为自定义命令。

相关内容