使用 grep 在 json 文件中搜索特殊模式

Question

添加-z到 grep 选项将使 grep 将换行符视为空终止符 ( \0)，而不是单独的行，但它们似乎在正则表达式中无法匹配。解决方法是简单地匹配所有内容 ( .*)，直到所需模式的结尾（在您的例子中为“created_at”）。

接下来，您可以添加-o让 grep 仅输出实际匹配的内容，否则它将输出整个文件（因为它现在本质上是一行巨大的文本）。或者，如果输出到文件的唯一目的是稍后使用，wc -l我建议您使用 grep 的-c选项，它将打印匹配的数量而不是匹配本身。

这转换为以下命令：

grep -wirnEzc '},.*created_at' *

扩展此模式以包括您之前的模式，我们得到：

grep -wirnEzc '},.*created_at":\s"Wed Oct 19 2(1:[0-5][0-9]:[0-5][0-9]|2:([0-2][0-9]:[0-5][0-9]|30:00)) .* 2016' *

Answer 1

添加-z到 grep 选项将使 grep 将换行符视为空终止符 ( \0)，而不是单独的行，但它们似乎在正则表达式中无法匹配。解决方法是简单地匹配所有内容 ( .*)，直到所需模式的结尾（在您的例子中为“created_at”）。

接下来，您可以添加-o让 grep 仅输出实际匹配的内容，否则它将输出整个文件（因为它现在本质上是一行巨大的文本）。或者，如果输出到文件的唯一目的是稍后使用，wc -l我建议您使用 grep 的-c选项，它将打印匹配的数量而不是匹配本身。

这转换为以下命令：

grep -wirnEzc '},.*created_at' *

扩展此模式以包括您之前的模式，我们得到：

grep -wirnEzc '},.*created_at":\s"Wed Oct 19 2(1:[0-5][0-9]:[0-5][0-9]|2:([0-2][0-9]:[0-5][0-9]|30:00)) .* 2016' *

相关内容