复制粘贴后如何对齐文本文件？

Question 1

你可以尝试这个技巧：

awk '(getline line < "file_1") > -1 {split(line,a); $7 = a[7]; $8 = a[8]; $9= a[9]} 1' file_2 | rev | column -t | rev > file_3

输出：

1GRM  C1   1  0.061  0.071  14.000  -0.5971   0.0204  -0.0724
1GRM  C2   2  0.184  0.142  14.000   0.4831  -0.8709  -0.2204
1GRM  C3   3  0.184  0.284   0.000  -0.7098   0.3449  -0.3952
1GRM  C4   4  0.061  0.355   0.000  -0.4066  -0.4079   0.1701
2GRM  C1   5  0.061  0.497  14.000   0.1844  -0.5441  -0.4893
2GRM  C2   6  0.184  0.568   0.000   1.1631  -0.2289  -0.8340
2GRM  C3   7  0.184  0.710   0.000  -0.4473  -0.2423  -0.3223
2GRM  C4   8  0.061  0.781   0.000  -0.4822   0.0086  -0.4791
3GRM  C1   9  0.061  0.923   0.000  -0.0345  -0.8207  -0.6602
3GRM  C2  10  0.184  0.994  14.000  -0.0345  -0.8207  -0.6602
3GRM  C3  11  0.184  1.136  14.000  -0.0345  -0.8207  -0.6602
3GRM  C4  12  0.061  1.207  14.000  -0.0345  -0.8207  -0.6602
4GRM  C1  13  0.061  1.349  14.000  -0.0345  -0.8207  -0.6602
4GRM  C2  14  0.184  1.420  14.000  -0.0345  -0.8207  -0.6602
4GRM  C3  15  0.184  1.562   0.000  -0.0345  -0.8207  -0.6602
4GRM  C4  16  0.061  1.633  14.000  -0.0345  -0.8207  -0.6602
5GRM  C1  17  0.061  1.775   0.000  -0.0345  -0.8207  -0.6602
5GRM  C2  18  0.184  1.846   0.002  -0.0345  -0.8207  -0.6602
5GRM  C3  19  0.184  1.988   0.001  -0.0345  -0.8207  -0.6602
5GRM  C4  20  0.061  2.059   0.000  -0.0345  -0.8207  -0.6602

Answer

你可以尝试这个技巧：

awk '(getline line < "file_1") > -1 {split(line,a); $7 = a[7]; $8 = a[8]; $9= a[9]} 1' file_2 | rev | column -t | rev > file_3

输出：

1GRM  C1   1  0.061  0.071  14.000  -0.5971   0.0204  -0.0724
1GRM  C2   2  0.184  0.142  14.000   0.4831  -0.8709  -0.2204
1GRM  C3   3  0.184  0.284   0.000  -0.7098   0.3449  -0.3952
1GRM  C4   4  0.061  0.355   0.000  -0.4066  -0.4079   0.1701
2GRM  C1   5  0.061  0.497  14.000   0.1844  -0.5441  -0.4893
2GRM  C2   6  0.184  0.568   0.000   1.1631  -0.2289  -0.8340
2GRM  C3   7  0.184  0.710   0.000  -0.4473  -0.2423  -0.3223
2GRM  C4   8  0.061  0.781   0.000  -0.4822   0.0086  -0.4791
3GRM  C1   9  0.061  0.923   0.000  -0.0345  -0.8207  -0.6602
3GRM  C2  10  0.184  0.994  14.000  -0.0345  -0.8207  -0.6602
3GRM  C3  11  0.184  1.136  14.000  -0.0345  -0.8207  -0.6602
3GRM  C4  12  0.061  1.207  14.000  -0.0345  -0.8207  -0.6602
4GRM  C1  13  0.061  1.349  14.000  -0.0345  -0.8207  -0.6602
4GRM  C2  14  0.184  1.420  14.000  -0.0345  -0.8207  -0.6602
4GRM  C3  15  0.184  1.562   0.000  -0.0345  -0.8207  -0.6602
4GRM  C4  16  0.061  1.633  14.000  -0.0345  -0.8207  -0.6602
5GRM  C1  17  0.061  1.775   0.000  -0.0345  -0.8207  -0.6602
5GRM  C2  18  0.184  1.846   0.002  -0.0345  -0.8207  -0.6602
5GRM  C3  19  0.184  1.988   0.001  -0.0345  -0.8207  -0.6602
5GRM  C4  20  0.061  2.059   0.000  -0.0345  -0.8207  -0.6602

Question 2

如果您需要严格对齐，您可能需要考虑使用明确格式化printf或sprintf语句例如。

$ awk '
    BEGIN{fmt="%8s%7s%5d%8.3f%8.3f%8.3f%8.4f%8.4f%8.4f"} 
    (getline line < "file 1") > -1 {n = split(line,a)} 
    n > 6 {$0 = sprintf(fmt, $1,$2,$3,$4,$5,$6,a[7],a[8],a[9])}
    1
  ' "file 2"
GRM in vacuum

192760

    1GRM     C1    1   0.061   0.071  14.000 -0.5971  0.0204 -0.0724
    1GRM     C2    2   0.184   0.142  14.000  0.4831 -0.8709 -0.2204
    1GRM     C3    3   0.184   0.284   0.000 -0.7098  0.3449 -0.3952
    1GRM     C4    4   0.061   0.355   0.000 -0.4066 -0.4079  0.1701
    2GRM     C1    5   0.061   0.497  14.000  0.1844 -0.5441 -0.4893
    2GRM     C2    6   0.184   0.568   0.000  1.1631 -0.2289 -0.8340
    2GRM     C3    7   0.184   0.710   0.000 -0.4473 -0.2423 -0.3223
    2GRM     C4    8   0.061   0.781   0.000 -0.4822  0.0086 -0.4791
    3GRM     C1    9   0.061   0.923   0.000 -0.0345 -0.8207 -0.6602
    3GRM     C2   10   0.184   0.994  14.000 -0.0345 -0.8207 -0.6602
    3GRM     C3   11   0.184   1.136  14.000 -0.0345 -0.8207 -0.6602
    3GRM     C4   12   0.061   1.207  14.000 -0.0345 -0.8207 -0.6602
    4GRM     C1   13   0.061   1.349  14.000 -0.0345 -0.8207 -0.6602
    4GRM     C2   14   0.184   1.420  14.000 -0.0345 -0.8207 -0.6602
    4GRM     C3   15   0.184   1.562   0.000 -0.0345 -0.8207 -0.6602
    4GRM     C4   16   0.061   1.633  14.000 -0.0345 -0.8207 -0.6602
    5GRM     C1   17   0.061   1.775   0.000 -0.0345 -0.8207 -0.6602
    5GRM     C2   18   0.184   1.846   0.002 -0.0345 -0.8207 -0.6602
    5GRM     C3   19   0.184   1.988   0.001 -0.0345 -0.8207 -0.6602
    5GRM     C4   20   0.061   2.059   0.000 -0.0345 -0.8207 -0.6602

Answer

如果您需要严格对齐，您可能需要考虑使用明确格式化printf或sprintf语句例如。

$ awk '
    BEGIN{fmt="%8s%7s%5d%8.3f%8.3f%8.3f%8.4f%8.4f%8.4f"} 
    (getline line < "file 1") > -1 {n = split(line,a)} 
    n > 6 {$0 = sprintf(fmt, $1,$2,$3,$4,$5,$6,a[7],a[8],a[9])}
    1
  ' "file 2"
GRM in vacuum

192760

    1GRM     C1    1   0.061   0.071  14.000 -0.5971  0.0204 -0.0724
    1GRM     C2    2   0.184   0.142  14.000  0.4831 -0.8709 -0.2204
    1GRM     C3    3   0.184   0.284   0.000 -0.7098  0.3449 -0.3952
    1GRM     C4    4   0.061   0.355   0.000 -0.4066 -0.4079  0.1701
    2GRM     C1    5   0.061   0.497  14.000  0.1844 -0.5441 -0.4893
    2GRM     C2    6   0.184   0.568   0.000  1.1631 -0.2289 -0.8340
    2GRM     C3    7   0.184   0.710   0.000 -0.4473 -0.2423 -0.3223
    2GRM     C4    8   0.061   0.781   0.000 -0.4822  0.0086 -0.4791
    3GRM     C1    9   0.061   0.923   0.000 -0.0345 -0.8207 -0.6602
    3GRM     C2   10   0.184   0.994  14.000 -0.0345 -0.8207 -0.6602
    3GRM     C3   11   0.184   1.136  14.000 -0.0345 -0.8207 -0.6602
    3GRM     C4   12   0.061   1.207  14.000 -0.0345 -0.8207 -0.6602
    4GRM     C1   13   0.061   1.349  14.000 -0.0345 -0.8207 -0.6602
    4GRM     C2   14   0.184   1.420  14.000 -0.0345 -0.8207 -0.6602
    4GRM     C3   15   0.184   1.562   0.000 -0.0345 -0.8207 -0.6602
    4GRM     C4   16   0.061   1.633  14.000 -0.0345 -0.8207 -0.6602
    5GRM     C1   17   0.061   1.775   0.000 -0.0345 -0.8207 -0.6602
    5GRM     C2   18   0.184   1.846   0.002 -0.0345 -0.8207 -0.6602
    5GRM     C3   19   0.184   1.988   0.001 -0.0345 -0.8207 -0.6602
    5GRM     C4   20   0.061   2.059   0.000 -0.0345 -0.8207 -0.6602

Question 3

除了已经给出的两个很棒的答案之外钢铁司机和薛定谔好奇心

试试这个（为了便于阅读，将一个命令分成四行，只需一次覆盖所有四行，然后粘贴到终端，然后按Enter），看看它是否适合你：

awk '(getline line < "file1") > -1 {split(line,a); l=length($2); \
if (l>2) {$2=substr($2,1,2) OFS substr($2,3)}; \
if (l>2) {$7 = a[6]; $8 = a[7]; $9= a[8]} else \
{$7 = a[7]; $8 = a[8]; $9= a[9]}}1' "file2" | column -t > "file3"

将file1和更改file2为您的输入文件，输出将保存到file3

注意：

您的列数在第 10002 行发生变化（第 2 列和第 3 列变为一列），并且命令的以下部分修复了此问题：

l=length($2); \
if (l>2) {$2=substr($2,1,2) OFS substr($2,3)}; \
if (l>2) {$7 = a[6]; $8 = a[7]; $9= a[8]} else \
{$7 = a[7]; $8 = a[8]; $9= a[9]}

Answer

除了已经给出的两个很棒的答案之外钢铁司机和薛定谔好奇心

试试这个（为了便于阅读，将一个命令分成四行，只需一次覆盖所有四行，然后粘贴到终端，然后按Enter），看看它是否适合你：

awk '(getline line < "file1") > -1 {split(line,a); l=length($2); \
if (l>2) {$2=substr($2,1,2) OFS substr($2,3)}; \
if (l>2) {$7 = a[6]; $8 = a[7]; $9= a[8]} else \
{$7 = a[7]; $8 = a[8]; $9= a[9]}}1' "file2" | column -t > "file3"

将file1和更改file2为您的输入文件，输出将保存到file3

注意：

您的列数在第 10002 行发生变化（第 2 列和第 3 列变为一列），并且命令的以下部分修复了此问题：

l=length($2); \
if (l>2) {$2=substr($2,1,2) OFS substr($2,3)}; \
if (l>2) {$7 = a[6]; $8 = a[7]; $9= a[8]} else \
{$7 = a[7]; $8 = a[8]; $9= a[9]}

Question 4

Freddy 在 Stack Exchange - Unix & Linux 中回答了这个问题。我发布这个答案只是为了防止其他人遇到同样的问题。

问题是文件 1 中有 8 或 9 个数据字段，而文件 2 中有 5 或 6 个数据字段。C3 9999 是一个格式错误的字段，或者 C410000 应该是两个字段 C4 和 10000。

要根据字段数量调整格式，您可以

使用两个格式字符串并在它们之间切换保存数组元素的数量 n 当您拆分行并取最后三个值 a[n-2], a[n-1], a[n]

awk '
BEGIN{
fmt1="%8s %6s%5s %7.3f %7.3f %7.3f %7.4f %7.4f %7.4f" ORS
fmt2="%8s %11s %7.3f %7.3f %7.3f %7.4f %7.4f %7.4f" ORS
}
(getline line < "file 1") > -1{
n=split(line, a)
}
NF<=3{ print; next }                                                     # 
print original line 
NF==6{ printf fmt1, $1, $2, $3, $4, $5, $6, a[n-2], a[n-1], a[n]; next } # 6 + 
3 fields
{ printf fmt2, $1, $2, $3, $4, $5, a[n-2], a[n-1], a[n] }                # 5 + 
3 fields
' "file 2" > "file 3"

Answer

Freddy 在 Stack Exchange - Unix & Linux 中回答了这个问题。我发布这个答案只是为了防止其他人遇到同样的问题。

问题是文件 1 中有 8 或 9 个数据字段，而文件 2 中有 5 或 6 个数据字段。C3 9999 是一个格式错误的字段，或者 C410000 应该是两个字段 C4 和 10000。

要根据字段数量调整格式，您可以

使用两个格式字符串并在它们之间切换保存数组元素的数量 n 当您拆分行并取最后三个值 a[n-2], a[n-1], a[n]

awk '
BEGIN{
fmt1="%8s %6s%5s %7.3f %7.3f %7.3f %7.4f %7.4f %7.4f" ORS
fmt2="%8s %11s %7.3f %7.3f %7.3f %7.4f %7.4f %7.4f" ORS
}
(getline line < "file 1") > -1{
n=split(line, a)
}
NF<=3{ print; next }                                                     # 
print original line 
NF==6{ printf fmt1, $1, $2, $3, $4, $5, $6, a[n-2], a[n-1], a[n]; next } # 6 + 
3 fields
{ printf fmt2, $1, $2, $3, $4, $5, a[n-2], a[n-1], a[n] }                # 5 + 
3 fields
' "file 2" > "file 3"

复制粘贴后如何对齐文本文件？

答案1

答案2

答案3

答案4

相关内容