我如何根据数据行的某些标志提取数据并用它们创建一个新文件

Question 1

使用 Raku（以前称为 Perl6）

~$ raku -ne '.trim-leading.put if .words[0].grep(rx/"**"? <(254 | 1 | 3 | 9)> /) | (.words[0].grep("4" | "**4") && .words[1].grep(rx/1000 | 925 | 850 /)) ;' UABalloon.txt
**254     12      1      JAN    2002
1  94703  72501  40.87N 72.87W    20   1116**
**3           OKX                32767     ms**
**9   1014     20   -105   -130    310      5**
**4   1000    131    -45    -95    315     20**
**4    925    741    -75   -155     20     36**
**4    850   1393   -117   -197    290     56**
254      0      2      JAN    2002
1  94703  72501  40.87N 72.87W    20   2305
3           OKX                32767     ms
9   1016     20    -13   -113    320     36
4   1000    150    -13   -123    320     72
4    925    764    -71   -141    320    144
4    850   1416   -125   -185    340    164

上面的代码.grep依赖于 Raku 的.words函数，该函数根据空格进行分割。包含的代码用于捕获以“ **”开头的行。该.trim-leading方法从输出中删除前导空格。

您可以看到此解决方案分两步进行。要删除开头和结尾的星号，请运行上面的代码，保存到 a tmp_file.txt，然后运行下面的代码：

~$ raku -pe 's:g/ \** (.+?) \** /$0/;' tmp.txt
254     12      1      JAN    2002
1  94703  72501  40.87N 72.87W    20   1116
3           OKX                32767     ms
9   1014     20   -105   -130    310      5
4   1000    131    -45    -95    315     20
4    925    741    -75   -155     20     36
4    850   1393   -117   -197    290     56
254      0      2      JAN    2002
1  94703  72501  40.87N 72.87W    20   2305
3           OKX                32767     ms
9   1016     20    -13   -113    320     36
4   1000    150    -13   -123    320     72
4    925    764    -71   -141    320    144
4    850   1416   -125   -185    340    164

HTH。

https://raku.org

Answer

使用 Raku（以前称为 Perl6）

~$ raku -ne '.trim-leading.put if .words[0].grep(rx/"**"? <(254 | 1 | 3 | 9)> /) | (.words[0].grep("4" | "**4") && .words[1].grep(rx/1000 | 925 | 850 /)) ;' UABalloon.txt
**254     12      1      JAN    2002
1  94703  72501  40.87N 72.87W    20   1116**
**3           OKX                32767     ms**
**9   1014     20   -105   -130    310      5**
**4   1000    131    -45    -95    315     20**
**4    925    741    -75   -155     20     36**
**4    850   1393   -117   -197    290     56**
254      0      2      JAN    2002
1  94703  72501  40.87N 72.87W    20   2305
3           OKX                32767     ms
9   1016     20    -13   -113    320     36
4   1000    150    -13   -123    320     72
4    925    764    -71   -141    320    144
4    850   1416   -125   -185    340    164

上面的代码.grep依赖于 Raku 的.words函数，该函数根据空格进行分割。包含的代码用于捕获以“ **”开头的行。该.trim-leading方法从输出中删除前导空格。

您可以看到此解决方案分两步进行。要删除开头和结尾的星号，请运行上面的代码，保存到 a tmp_file.txt，然后运行下面的代码：

~$ raku -pe 's:g/ \** (.+?) \** /$0/;' tmp.txt
254     12      1      JAN    2002
1  94703  72501  40.87N 72.87W    20   1116
3           OKX                32767     ms
9   1014     20   -105   -130    310      5
4   1000    131    -45    -95    315     20
4    925    741    -75   -155     20     36
4    850   1393   -117   -197    290     56
254      0      2      JAN    2002
1  94703  72501  40.87N 72.87W    20   2305
3           OKX                32767     ms
9   1016     20    -13   -113    320     36
4   1000    150    -13   -123    320     72
4    925    764    -71   -141    320    144
4    850   1416   -125   -185    340    164

HTH。

https://raku.org

Question 2

$ awk '$1 ~ /^(254|1|3|9)$/ || ($1 == 4 && $2 ~ /^(1000|925|850)$/)' input.txt  
254     12      1      JAN    2002
  1  94703  72501  40.87N 72.87W    20   1116
  3           OKX                32767     ms
  9   1014     20   -105   -130    310      5
  4   1000    131    -45    -95    315     20
  4    925    741    -75   -155     20     36
  4    850   1393   -117   -197    290     56
254      0      2      JAN    2002
  1  94703  72501  40.87N 72.87W    20   2305
  3           OKX                32767     ms
  9   1016     20    -13   -113    320     36
  4   1000    150    -13   -123    320     72
  4    925    764    -71   -141    320    144
  4    850   1416   -125   -185    340    164

这将打印输入行，其中：

$1 是允许的值之一（254、1、3 或 9）
1 美元等于 4和2 美元可以是 1000、925 或 850。

所有其他行都将被忽略。

注意：这与您的示例输出不完全匹配，因为a）您的示例输出与您想要的描述不匹配（*）和b）您的评论说您不希望以2开头的行。

(*) 至少，尽我所能理解。您的描述非常不清楚且难以解析...我花了几分钟才破译它，但我仍然不确定它是否正确。要么你想要的比看起来复杂得多，要么你以一种异常复杂的方式编写了它。

Answer

$ awk '$1 ~ /^(254|1|3|9)$/ || ($1 == 4 && $2 ~ /^(1000|925|850)$/)' input.txt  
254     12      1      JAN    2002
  1  94703  72501  40.87N 72.87W    20   1116
  3           OKX                32767     ms
  9   1014     20   -105   -130    310      5
  4   1000    131    -45    -95    315     20
  4    925    741    -75   -155     20     36
  4    850   1393   -117   -197    290     56
254      0      2      JAN    2002
  1  94703  72501  40.87N 72.87W    20   2305
  3           OKX                32767     ms
  9   1016     20    -13   -113    320     36
  4   1000    150    -13   -123    320     72
  4    925    764    -71   -141    320    144
  4    850   1416   -125   -185    340    164

这将打印输入行，其中：

$1 是允许的值之一（254、1、3 或 9）
1 美元等于 4和2 美元可以是 1000、925 或 850。

所有其他行都将被忽略。

注意：这与您的示例输出不完全匹配，因为a）您的示例输出与您想要的描述不匹配（*）和b）您的评论说您不希望以2开头的行。

(*) 至少，尽我所能理解。您的描述非常不清楚且难以解析...我花了几分钟才破译它，但我仍然不确定它是否正确。要么你想要的比看起来复杂得多，要么你以一种异常复杂的方式编写了它。

我如何根据数据行的某些标志提取数据并用它们创建一个新文件

答案1

答案2

相关内容