如何解决复制粘贴后文本文件中的列对齐问题？

Question

问题是中有 8 或 9 个数据字段，file1中有 5 或 6 个数据字段file2。要么C3 9999 是一个格式错误的字段，要么C410000应该是两个字段C4和10000。

要根据字段数量调整格式，您可以

使用两个格式字符串并在它们之间切换
n分割行并取最后三个值时保存数组元素的数量a[n-2], a[n-1],a[n]

awk '
  BEGIN{
    fmt1="%8s %6s%5s %7.3f %7.3f %7.3f %7.4f %7.4f %7.4f" ORS
    fmt2="%8s %11s %7.3f %7.3f %7.3f %7.4f %7.4f %7.4f" ORS
  }
  (getline line < "file 1") > -1{
    n=split(line, a)
  }
  NF<=3{ print; next }                                                     # print original line 
  NF==6{ printf fmt1, $1, $2, $3, $4, $5, $6, a[n-2], a[n-1], a[n]; next } # 6 + 3 fields
  { printf fmt2, $1, $2, $3, $4, $5, a[n-2], a[n-1], a[n] }                # 5 + 3 fields
' "file 2" > "file 3"

输出：

 ...
 2500GRM     C3 9999  15.433   8.378   0.000  0.2372 -0.2989 -0.0758
 2500GRM     C410000  15.310   8.449   0.000  0.2603 -0.2492 -0.2394
 2501GRM     C110001  15.310   8.591   0.000  0.0887 -0.2458 -0.7014
 2501GRM     C210002  15.433   8.662   0.000 -0.0788  0.0598 -0.9619
 ...

Answer 1

问题是中有 8 或 9 个数据字段，file1中有 5 或 6 个数据字段file2。要么C3 9999 是一个格式错误的字段，要么C410000应该是两个字段C4和10000。

要根据字段数量调整格式，您可以

使用两个格式字符串并在它们之间切换
n分割行并取最后三个值时保存数组元素的数量a[n-2], a[n-1],a[n]

awk '
  BEGIN{
    fmt1="%8s %6s%5s %7.3f %7.3f %7.3f %7.4f %7.4f %7.4f" ORS
    fmt2="%8s %11s %7.3f %7.3f %7.3f %7.4f %7.4f %7.4f" ORS
  }
  (getline line < "file 1") > -1{
    n=split(line, a)
  }
  NF<=3{ print; next }                                                     # print original line 
  NF==6{ printf fmt1, $1, $2, $3, $4, $5, $6, a[n-2], a[n-1], a[n]; next } # 6 + 3 fields
  { printf fmt2, $1, $2, $3, $4, $5, a[n-2], a[n-1], a[n] }                # 5 + 3 fields
' "file 2" > "file 3"

输出：

 ...
 2500GRM     C3 9999  15.433   8.378   0.000  0.2372 -0.2989 -0.0758
 2500GRM     C410000  15.310   8.449   0.000  0.2603 -0.2492 -0.2394
 2501GRM     C110001  15.310   8.591   0.000  0.0887 -0.2458 -0.7014
 2501GRM     C210002  15.433   8.662   0.000 -0.0788  0.0598 -0.9619
 ...

如何解决复制粘贴后文本文件中的列对齐问题？

答案1

相关内容