shell 脚本根据 2 列连接 2 个文件，如果找到匹配项，则写入一些字段

Question

使用bash：

join -t @ -1 2 -2 2 -o2.1,1.2 -a 1 -e NULL \
    <( sort -t @ -k2 <( sed 's/,/@/' abc.csv ) ) \
    <( sort -t @ -k2 <( sed 's/,/@/' xyz.csv ) ) | sed 's/@/,/'

有了这两个文件

TBL_NAME,SANDBOX_NAME,SCRIPT_NAME
ccti_prod_attdnl_ext,abc_ext,101_ext_table.m_diag.pset
ccti_prod_attdnl_ext,abc_ids,101_ext_table.m_diag.pset
ccti_prod_attdnl_ext,xxx_ids,101_ext_table.m_diag.pset

（abc.csv从问题中，abs替换为abc并添加不匹配的行）并且

PID,SANDBOX_NAME,SCRIPT_NAME
11065,abc_ext,101_ext_table.m_diag.pset
11066,abc_ext,101_ext_table.m_diag.pset
11067,abc_ids,101_ext_table.m_diag.pset

（xyz.csv来自问题），这会产生

PID,SANDBOX_NAME,SCRIPT_NAME
11065,abc_ext,101_ext_table.m_diag.pset
11066,abc_ext,101_ext_table.m_diag.pset
11067,abc_ids,101_ext_table.m_diag.pset
NULL,xxx_ids,101_ext_table.m_diag.pset

该操作对将第一个逗号替换为（数据中不存在的任何字符，至少不在第一个字段中）并对第二个分隔字段（最后两个逗号分隔字段）上的每个输入文件进行排序的join结果进行操作。它输出第一个文件中的第一个字段和第二个文件中的第二个字段。它还添加第一个文件中不匹配的条目，并用字符串替换空字段。@@NULL

sed然后末尾的the替换@为逗号。

Answer 1