我需要比较两个文件并使用 shell 脚本显示表格式的差异。例如。
文件1.txt
ap-2.21.3.rpm
bp-3.42.4.rpm
cp-devel-3.23.2.rpm
ep-devel- 2.23.2-23.rpm
文件2.txt
ap-2.21.3.rpm
bp-3.43.4.rpm
cp-devel-4.33.2.rpm
dp-4.52.4.rpm
输出将在:
Name | file1 | file2
-------------------------------+---------------------------+---------------------------
bp | 3.42.4 | 3.43.4
cp-devel | 3.23.2 | 4.33.2
dp | | 4.52.4
ep-devel | 2.23.2-23 |
答案1
cat file1| awk -F "-" '{print $2}'| sed "s/\.[a-z].*//g">file_1_final.txt
cat file2| awk -F "-" '{print $2}'| sed "s/\.[a-z].*//g">file_2_final.txt
paste file_1_final.txt file_2_final.txt | sed '1i file1 file2' >combined_file1_file2
awk -F "-" 'NR==FNR{a[$1];next}($1 in a){print $1}' file1 file2>>common_difference_file_1_2
awk -F "-" 'NR==FNR{a[$1];next}!($1 in a){print $1}' file1 file2>>common_difference_file_1_2
sed -i '1i name' common_difference_file_1_2
paste common_difference_file_1_2 combined_file1_file2
输出:
name file1 file2
ap 2.21.3 2.35.3
bp 3.42.4 3.43.4
cp 3.23.2 4.33.2
dp 4.52.4
答案2
根据您的评论,可以这样描述文件名:
- 程序版本由数字、点和连字符组成,前面有一个连字符
- 程序名称都是连字符之前的字符
- 版本号由一个点和一个字母分隔到下一个块
有了这些信息,我们就可以用来sed
转换每个文件的表中的名称,其中仅包含程序名称和版本号:
$ sed -n 's|^\(.\+\)-\([0-9.-]\+\)\..*|\1 \2|p' file1.txt
$ sed -n 's|^\(.\+\)-\([0-9.-]\+\)\..*|\1 \2|p' file2.txt
然后可以用来awk
收集两个文件中的程序名称,存储每个文件中每个程序的版本并打印一个汇总表:
$ awk -v FS=" " -v OFS="\t" ' \
{ program[$1]++; } \
NR==FNR { f1[$1] = $2; next; } \
{ f2[$1] = $2; } \
END { for(i in program) print i, f1[i], f2[i]; }' \
<(sed -n 's|^\(.\+\)-\([0-9.-]\+\)\..*|\1 \2|p' file1.txt) \
<(sed -n 's|^\(.\+\)-\([0-9.-]\+\)\..*|\1 \2|p' file2.txt)