shell中两个输出的笛卡尔积

Question 1

您需要第二个循环来处理第一行$filename

for filename in /home/vikrant_singh_rana/AAA_USP/sample-Files/*; do
    # ...
    b=$(basename "$filename" ".csv" | grep -oP '(?<=_).*(?=\-\d\d\d)' )
    for c in $(head -n1 "$filename" | sed 's/,/ /g'); do
        printf '%s,%s\n' "$b" "$c"
    done
done > test.txt

_{PS：这假设的第一行中没有空格字符或换行符$filename。}

Answer

您需要第二个循环来处理第一行$filename

for filename in /home/vikrant_singh_rana/AAA_USP/sample-Files/*; do
    # ...
    b=$(basename "$filename" ".csv" | grep -oP '(?<=_).*(?=\-\d\d\d)' )
    for c in $(head -n1 "$filename" | sed 's/,/ /g'); do
        printf '%s,%s\n' "$b" "$c"
    done
done > test.txt

_{PS：这假设的第一行中没有空格字符或换行符$filename。}

Question 2

#!/bin/sh

for pathname in /home/vikrant_singh_rana/AAA_USP/sample-Files/*.csv
do
    name=${pathname##*/}   # remove directory path
    name=${name#*_}        # remove *_ prefix (up to first underscore)
    name=${name%%-*}       # remove -* suffix (from first dash)

    awk -F , -v name="$name" 'BEGIN { OFS=FS } { for (i = 1; i <= NF; ++i) print name, $i; exit }' "$pathname"
done

这会迭代所有 CSV 文件，并NNNN_从名称中删除目录路径和初始字符串，以及第一个-字符之后的所有内容。该字符串保存在$name.

然后在该文件上运行一个简短的awk程序，该程序将文件第一行中的字段打印在单独的行上，每行都以中提取的值作为前缀$name。

这假设 CSV 文件是简单的第一行字段中没有嵌入逗号或换行符的 CSV 文件。

如果你没有数千个文件，你也可以awk像这样使用 GNU：

awk -F , '
    BEGIN { OFS=FS }
    BEGINFILE {
        name = FILENAME
        sub(".*/", "", name)       # remove directory path
        sub("^[^_]*_", "", name)   # remove *_ prefix (up to first underscore)
        sub("-.*", "", name)       # remove -* suffix (from first dash)
    }
    {
        for (i = 1; i <= NF; ++i) print name, $i
        nextfile
    }' /home/vikrant_singh_rana/AAA_USP/sample-Files/*.csv

Answer

#!/bin/sh

for pathname in /home/vikrant_singh_rana/AAA_USP/sample-Files/*.csv
do
    name=${pathname##*/}   # remove directory path
    name=${name#*_}        # remove *_ prefix (up to first underscore)
    name=${name%%-*}       # remove -* suffix (from first dash)

    awk -F , -v name="$name" 'BEGIN { OFS=FS } { for (i = 1; i <= NF; ++i) print name, $i; exit }' "$pathname"
done

这会迭代所有 CSV 文件，并NNNN_从名称中删除目录路径和初始字符串，以及第一个-字符之后的所有内容。该字符串保存在$name.

然后在该文件上运行一个简短的awk程序，该程序将文件第一行中的字段打印在单独的行上，每行都以中提取的值作为前缀$name。

这假设 CSV 文件是简单的第一行字段中没有嵌入逗号或换行符的 CSV 文件。

如果你没有数千个文件，你也可以awk像这样使用 GNU：

awk -F , '
    BEGIN { OFS=FS }
    BEGINFILE {
        name = FILENAME
        sub(".*/", "", name)       # remove directory path
        sub("^[^_]*_", "", name)   # remove *_ prefix (up to first underscore)
        sub("-.*", "", name)       # remove -* suffix (from first dash)
    }
    {
        for (i = 1; i <= NF; ++i) print name, $i
        nextfile
    }' /home/vikrant_singh_rana/AAA_USP/sample-Files/*.csv

shell中两个输出的笛卡尔积

答案1

答案2

相关内容