将多组文件“聚合”在一起的最简单方法是什么?

将多组文件“聚合”在一起的最简单方法是什么?

我有符合这种模式命名约定的文件:

bond_7.LEU.CA.1.dat
bond_7.LEU.CA.2.dat
bond_7.LEU.CA.3.dat
bond_12.ALA.CB.1.dat
bond_12.ALA.CB.2.dat
bond_12.ALA.CB.3.dat
...

我想将同一组的所有文件合并为一个文件。例如:

cat bond_7.LEU.CA.*.dat > ../bondvalues/bond_7.LEU.CA.1_3.dat

这些文件数量庞大。如何使用 bash 脚本来实现?

答案1

假设您提供的示例反映了您的所有文件,则以下内容应该可以解决问题:

for f in *.1.dat
do
  cat ${f%%1.dat}* > ${f%%1.dat}1_3.dat
done

这要求每个组都包含一个扩展名为 .1.dat 的文件。

答案2

printf "%s\n" * | cut -d. -f1-3 | sort -u | while read prefix; do
  files=(${prefix}*)
  first=$(cut -d. -f4 <<< "${files[0]}")
  last=$(cut -d. -f4 <<< "${files[${#files[@]}-1]}")
  newfile=$(printf "../bondvalues/%s.%s_%s.dat" "$prefix" "$first" "$last")
  cat "${files[@]}" > "$newfile"
done 

相关内容