如何比较两个文件并以表格格式显示

如何比较两个文件并以表格格式显示

我需要比较两个文件并使用 shell 脚本显示表格式的差异。例如。

文件1.txt

ap-2.21.3.rpm
bp-3.42.4.rpm
cp-devel-3.23.2.rpm
ep-devel- 2.23.2-23.rpm

文件2.txt

ap-2.21.3.rpm
bp-3.43.4.rpm
cp-devel-4.33.2.rpm
dp-4.52.4.rpm

输出将在:

Name                           |        file1              | file2
-------------------------------+---------------------------+---------------------------
bp                             |         3.42.4            | 3.43.4
cp-devel                       |         3.23.2            | 4.33.2
dp                             |                           | 4.52.4
ep-devel                       |         2.23.2-23         | 

答案1

  1. cat file1| awk -F "-" '{print $2}'| sed "s/\.[a-z].*//g">file_1_final.txt
  2. cat file2| awk -F "-" '{print $2}'| sed "s/\.[a-z].*//g">file_2_final.txt
  3. paste file_1_final.txt file_2_final.txt | sed '1i file1 file2' >combined_file1_file2
  4. awk -F "-" 'NR==FNR{a[$1];next}($1 in a){print $1}' file1 file2>>common_difference_file_1_2
  5. awk -F "-" 'NR==FNR{a[$1];next}!($1 in a){print $1}' file1 file2>>common_difference_file_1_2
  6. sed -i '1i name' common_difference_file_1_2
  7. paste common_difference_file_1_2 combined_file1_file2

输出:

name    file1     file2
ap  2.21.3  2.35.3
bp  3.42.4  3.43.4
cp  3.23.2  4.33.2
dp      4.52.4

答案2

根据您的评论,可以这样描述文件名:

  • 程序版本由数字、点和连字符组成,前面有一个连字符
  • 程序名称都是连字符之前的字符
  • 版本号由一个点和一个字母分隔到下一个块

有了这些信息,我们就可以用来sed转换每个文件的表中的名称,其中仅包含程序名称和版本号:

$ sed -n 's|^\(.\+\)-\([0-9.-]\+\)\..*|\1 \2|p' file1.txt 
$ sed -n 's|^\(.\+\)-\([0-9.-]\+\)\..*|\1 \2|p' file2.txt 

然后可以用来awk收集两个文件中的程序名称,存储每个文件中每个程序的版本并打印一个汇总表:

$ awk -v FS=" " -v OFS="\t" ' \
    { program[$1]++; } \
    NR==FNR { f1[$1] = $2; next; } \
    { f2[$1] = $2; } \
    END { for(i in program) print i, f1[i], f2[i]; }' \
   <(sed -n 's|^\(.\+\)-\([0-9.-]\+\)\..*|\1 \2|p' file1.txt) \
   <(sed -n 's|^\(.\+\)-\([0-9.-]\+\)\..*|\1 \2|p' file2.txt)

相关内容