使用 sed 删除数字字符串末尾的字符

Question

关于你的正则表达式，我注意到了以下几点：

指定字符类时，字母之间不要使用逗号。您可以使用破折号来指定范围，但在本例中，应该[C,S,R,P,Q]使用而不是[CSRPQ]。
sed不需要匹配整行，因此您只需构建一个模式来匹配带有尾随字母的数字，然后将其替换为数字本身（删除字母）。

我获取了您提供的输入文件并测试了以下内容sed命令：

sed -E 's/([0-9]+)[CSRPQ]/\1/g' sample.txt

输出结果如下：

USC00020958       -7777   656   721   803   891   975   972   941   906   809   695   605
USC00021001         378   389   448   522   628   736   774   742   674   562   454   376
USC00021026         689   729   792   873   969  1060  1082  1068  1015   903   775   682
USC00021050         663   713   796   885   984  1079  1122  1103  1036   904   754   651
USC00501466         -77     8   168   408   593   723   733   660   529   273    54    -7
USW00501492         -43    18   132   308   510   666   687   605   466   239    45    12
USW00501497           3    -1     0   203   388   539   558   493   362   175    51    27
USW00501684        -118     0   211   413   573   700   710   644   520   294    35   -67
USW00501926         184   223   303   418   544   651   661   617   519   353   227 -7777

该命令匹配任何带有尾随的数字[CSRPQ]，然后删除字母。

另外，如果你想删除所有空格并用逗号替换以将其转换为 CSV，sed允许您链接表达式。但是，当指定多个脚本时，您需要-e在它们前面放置sed脚本将遵循该脚本。来自帮助：

Usage: sed [OPTION]... {script-only-if-no-other-script} [input-file]...

  -e script, --expression=script
                 add the script to the commands to be executed

以下是一个例子：

sed -E -e 's/([0-9]+)[CSRPQ]/\1/g' -e 's/\s+/,/g' sample.txt

这表示运行第一个替换，然后运行第二个替换，将重复的空格字符替换为单个逗号。这将产生以下输出：

USC00020958,-7777,656,721,803,891,975,972,941,906,809,695,605
USC00021001,378,389,448,522,628,736,774,742,674,562,454,376
USC00021026,689,729,792,873,969,1060,1082,1068,1015,903,775,682
USC00021050,663,713,796,885,984,1079,1122,1103,1036,904,754,651
USC00501466,-77,8,168,408,593,723,733,660,529,273,54,-7
USW00501492,-43,18,132,308,510,666,687,605,466,239,45,12
USW00501497,3,-1,0,203,388,539,558,493,362,175,51,27
USW00501684,-118,0,211,413,573,700,710,644,520,294,35,-67
USW00501926,184,223,303,418,544,651,661,617,519,353,227,-7777

希望这可以帮助！

Answer 1