根据 =0.00000000 的列数过滤文件的行

Question 1

我能找到的最简单的解决方案是（是的，就是这么简单）：

awk -F '=0\\.00000000'   'NF<=2'   file

对此有几种可能的解决方案。

grep查找文本的速度相当快，它只需要正确的正则表达式。
```
grep -vE '^([^ ]* ){5}.*(=0\.00000000.*){2}' file
```
- 该^([^ ]* ){5}部分将从一行的开头 ( ) 开始匹配由空格（{5}其中 5 ( ) 个）分隔的^列（不是空格）。
- 然后，.*(=0\.00000000.*){2}将匹配该行上的至少两个=0\.00000000。
- 最后，反转匹配 ( -v) 并使用扩展 (ERE) 正则表达式（较少\需要）。

0它将严格限制要匹配的 s数量。

Sed 具有类似的正则表达式：
```
sed '/^\([^ ]* \)\{5\}.*\(=0\.00000000.*\)\{2\}/d' file
```
但它会打印任何与模式不匹配的行（很容易失败）。

或者

awk 将这一行视为文本。
```
awk -F '=0\\.00000000' 'NF<=2' file
```
awk，它可以解析浮点数，然后检查0值。

请使用@GlennJackman 的答案。

Answer

我能找到的最简单的解决方案是（是的，就是这么简单）：

awk -F '=0\\.00000000'   'NF<=2'   file

对此有几种可能的解决方案。

grep查找文本的速度相当快，它只需要正确的正则表达式。
```
grep -vE '^([^ ]* ){5}.*(=0\.00000000.*){2}' file
```
- 该^([^ ]* ){5}部分将从一行的开头 ( ) 开始匹配由空格（{5}其中 5 ( ) 个）分隔的^列（不是空格）。
- 然后，.*(=0\.00000000.*){2}将匹配该行上的至少两个=0\.00000000。
- 最后，反转匹配 ( -v) 并使用扩展 (ERE) 正则表达式（较少\需要）。

0它将严格限制要匹配的 s数量。

Sed 具有类似的正则表达式：
```
sed '/^\([^ ]* \)\{5\}.*\(=0\.00000000.*\)\{2\}/d' file
```
但它会打印任何与模式不匹配的行（很容易失败）。

或者

awk 将这一行视为文本。
```
awk -F '=0\\.00000000' 'NF<=2' file
```
awk，它可以解析浮点数，然后检查0值。

请使用@GlennJackman 的答案。

Question 2

使用空格或=作为字段分隔符，从第 7 列开始计算零值：如果有多个值，则继续到下一行，否则打印该行。

awk -F '[= ]+' '{
    z = 0
    for (c = 7; c <= NF; c += 2)
        if ($c == 0.0 && ++z > 1)
            next
    print
}' file

Answer

使用空格或=作为字段分隔符，从第 7 列开始计算零值：如果有多个值，则继续到下一行，否则打印该行。

awk -F '[= ]+' '{
    z = 0
    for (c = 7; c <= NF; c += 2)
        if ($c == 0.0 && ++z > 1)
            next
    print
}' file

Question 3

这是打印不包含多个该字符串实例的行的最简单方法：

grep -v '=0\.00000000.*0\.00000000' file.txt

由于您的文件仅在第 5 列之后出现该字符串，并且您只想打印它出现一次或根本不出现的行，因此上面的代码将打印它不出现多次的行。该模式=0\.00000000.*0\.00000000匹配一行上的任意两个实例，=0.00000000无论它们出现在哪一列中，并且如果一行上的任何位置有第三个、第四个、第五个等，则不会打印该行。您尝试的命令会打印不包含该字符串的任何实例的任何行，因此它不会打印您不想要的第二行。

如果您希望它打印不包含该字符串的更多实例的行，只需添加另一个.*0.00000000.例如，要打印不超过三行的行：

grep -v '=0\.00000000.*0\.00000000.*0\.00000000' file.txt

这将包括第三行，其中包含该字符串的三个实例。

Answer

这是打印不包含多个该字符串实例的行的最简单方法：

grep -v '=0\.00000000.*0\.00000000' file.txt

由于您的文件仅在第 5 列之后出现该字符串，并且您只想打印它出现一次或根本不出现的行，因此上面的代码将打印它不出现多次的行。该模式=0\.00000000.*0\.00000000匹配一行上的任意两个实例，=0.00000000无论它们出现在哪一列中，并且如果一行上的任何位置有第三个、第四个、第五个等，则不会打印该行。您尝试的命令会打印不包含该字符串的任何实例的任何行，因此它不会打印您不想要的第二行。

如果您希望它打印不包含该字符串的更多实例的行，只需添加另一个.*0.00000000.例如，要打印不超过三行的行：

grep -v '=0\.00000000.*0\.00000000.*0\.00000000' file.txt

这将包括第三行，其中包含该字符串的三个实例。

根据 =0.00000000 的列数过滤文件的行

答案1

答案2

答案3

相关内容