在 JSON 文件中查找模式

Question 1

如果它可以在线的任何地方，也可以在两者之间，我想

grep -wirn 'Wed Oct 19 .* 2016' *

应该得到它...

如果你只想要文件名，请使用-l

grep -wirl 'Wed Oct 19 .* 2016' *

笔记

-w使用单词边界，以防您想要的文本粘在我们不想匹配的其他内容上（在这种情况下不太可能）
-l只打印包含匹配项的文件的文件名
.*此处任意数量的任意字符

使用以下命令解析此文件可能没问题grep对于如此简单的事情，用 JSON 解析器David Foerster 的回答是正确的方法（即它可能会更可靠，特别是当您需要做任何复杂的事情时）。

Answer

如果它可以在线的任何地方，也可以在两者之间，我想

grep -wirn 'Wed Oct 19 .* 2016' *

应该得到它...

如果你只想要文件名，请使用-l

grep -wirl 'Wed Oct 19 .* 2016' *

笔记

-w使用单词边界，以防您想要的文本粘在我们不想匹配的其他内容上（在这种情况下不太可能）
-l只打印包含匹配项的文件的文件名
.*此处任意数量的任意字符

使用以下命令解析此文件可能没问题grep对于如此简单的事情，用 JSON 解析器David Foerster 的回答是正确的方法（即它可能会更可靠，特别是当您需要做任何复杂的事情时）。

Question 2

由于您正在处理 JSON 数据，因此我将使用实际的 JSON 解析器：

LC_TIME=POSIX jq \
  --argjson year 2016 --argjson month 10 --argjson day 19 \
  --arg timefmt '%a %b %d %T %z %Y' \
  '.. | .created_at? | select(.) | strptime($timefmt) | select(.[0] == $year and .[1] + 1 == $month and .[2] == $day) | strftime($timefmt)' \
  twitter.json

--arg并--argjson设置整个 jq 脚本中使用的命名变量。
..返回所有递归嵌套的对象。
.created_at?created_at如果可用则返回具有键的条目的值，null否则返回该条目的值。
select(.)仅返回 ECMA 脚本中“真”的值，其中包括非空字符串但不包括null。
strptime($timefmt)根据以下方式解析日期时间字符串strptime(3)并返回“分解的”日期时间值的元组。
select(.[0] == $year and .[1] + 1 == $month and .[2] == $day)$year仅返回给定表达式计算结果为真的值，在这种情况下，变量、$month和的值与$day它们各自的日期时间元组条目匹配。
strftime($timefmt)返回按照以下格式格式化为字符串的日期时间元组strftime(3)

这需要 jq v1.5 或更高版本，可在 Ubuntu Xenial（或更高版本）的存储库中找到同名包。

Answer

由于您正在处理 JSON 数据，因此我将使用实际的 JSON 解析器：

LC_TIME=POSIX jq \
  --argjson year 2016 --argjson month 10 --argjson day 19 \
  --arg timefmt '%a %b %d %T %z %Y' \
  '.. | .created_at? | select(.) | strptime($timefmt) | select(.[0] == $year and .[1] + 1 == $month and .[2] == $day) | strftime($timefmt)' \
  twitter.json

--arg并--argjson设置整个 jq 脚本中使用的命名变量。
..返回所有递归嵌套的对象。
.created_at?created_at如果可用则返回具有键的条目的值，null否则返回该条目的值。
select(.)仅返回 ECMA 脚本中“真”的值，其中包括非空字符串但不包括null。
strptime($timefmt)根据以下方式解析日期时间字符串strptime(3)并返回“分解的”日期时间值的元组。
select(.[0] == $year and .[1] + 1 == $month and .[2] == $day)$year仅返回给定表达式计算结果为真的值，在这种情况下，变量、$month和的值与$day它们各自的日期时间元组条目匹配。
strftime($timefmt)返回按照以下格式格式化为字符串的日期时间元组strftime(3)

这需要 jq v1.5 或更高版本，可在 Ubuntu Xenial（或更高版本）的存储库中找到同名包。

Question 3

这个 grep 应该能够获取所需的行：

grep -E ".*Wed Oct 19.*2016$" reg.txt

仅搜索文件并输出文件名：

grep -Erl ".*Wed Oct 19.*2016$" /path/to/folders/to/search

Answer

这个 grep 应该能够获取所需的行：

grep -E ".*Wed Oct 19.*2016$" reg.txt

仅搜索文件并输出文件名：

grep -Erl ".*Wed Oct 19.*2016$" /path/to/folders/to/search

在 JSON 文件中查找模式

答案1

笔记

答案2

答案3

相关内容