根据另一个文件中的id列表过滤csv文件

Question 1

如果文件具有相同顺序的公共行，

join -t, -j1 file1.txt file2.txt

解释

请参阅man join获取更多信息。基本上，join这两个文件，跳过“不可配对的行”。分隔符是逗号-t,，并在字段 1 上连接-j1。

Answer

如果文件具有相同顺序的公共行，

join -t, -j1 file1.txt file2.txt

请参阅man join获取更多信息。基本上，join这两个文件，跳过“不可配对的行”。分隔符是逗号-t,，并在字段 1 上连接-j1。

Question 2

使用csvjoin基于Python的csvkit

$ csvjoin -Ic id file\ 1 file\ 2
id,ICD,CT
16214497,008.8,1
27154870,780.79,1

该-I标志禁用类型推断，以便将此类字段008.8视为字符串而不是数字（这可能会导致重新格式化）。此方法似乎可以透明地处理 DOS/Windows 样式的行结尾。

使用 awk 的替代快速连接：

awk -F, 'NR==FNR {a[$1]; next} $1 in a' file\ 2 file\ 1

如果您的文件有 DOS/Windows 行结尾（CRLF 代替普通 LF），那么您可以尝试

awk -vRS='\r\n' -F, 'NR==FNR {a[$1]; next} $1 in a' file\ 2 file\ 1

dos2unix或先使用、等转换文件tr。sed

Answer