如何在日志中的单词之间进行grep？

Question 1

如果您只需要每行图案之间的文本，请执行以下操作：

sed 's/.*raw\(.*\)transformed.*/\1/'

\(.*\) 记得使用输出的文本\1。线上的其他东西不输出。

Answer

如果您只需要每行图案之间的文本，请执行以下操作：

sed 's/.*raw\(.*\)transformed.*/\1/'

\(.*\) 记得使用输出的文本\1。线上的其他东西不输出。

Question 2

如果你有支持 PCRE 的 grep，你可以这样做

$ grep -oP 'Parameters: {"raw_message"=>"\K.+?(?=", "transformed_data")' file

或者，如果您的文件如您所示，请简化为：

$ grep -oP '=>"\K.+?(?=",)' file

或者，使用awk，将字段分隔符设置为 an=>或 a,并打印第二个字段（这也与", 管道通过tr -d"` 匹配以删除它们）：

$ awk -F'[,>]' '{print $2}' file

或者，您可以只 grep 查找以 MSH 开头的第一个带引号的字符串：

$ grep -Po '"MSH.+?"' file

并且，避免引号：

$ grep -Po '"\KMSH.*?(?=")' file

Answer

如果你有支持 PCRE 的 grep，你可以这样做

$ grep -oP 'Parameters: {"raw_message"=>"\K.+?(?=", "transformed_data")' file

或者，如果您的文件如您所示，请简化为：

$ grep -oP '=>"\K.+?(?=",)' file

或者，使用awk，将字段分隔符设置为 an=>或 a,并打印第二个字段（这也与", 管道通过tr -d"` 匹配以删除它们）：

$ awk -F'[,>]' '{print $2}' file

或者，您可以只 grep 查找以 MSH 开头的第一个带引号的字符串：

$ grep -Po '"MSH.+?"' file

并且，避免引号：

$ grep -Po '"\KMSH.*?(?=")' file

Question 3

你中的引号示例行似乎确实相当重要。如果该字符串中不可能出现转义引号，那么您所要做的就是：

cut -d\" -f4 <in >out

获取一行中的第四个字段，并用"双引号分隔符分隔。

如果双引号可能会在该字符串中转义 - 例如通过反斜杠 - 那么你可以这样做：

sed 's/[^>]*."//;s/", ".*//'

...安全地只获取您想要的字段，而不会跳过任何内容，也不会出现误报。如果这些是唯一的引号字符，上面的两个替换应该可以很好地处理这个问题（不计算反斜杠）可以使用它，并且假设所有位都以raw这样的方式开始>并且在它之前没有>任何地方发生。

Answer

你中的引号示例行似乎确实相当重要。如果该字符串中不可能出现转义引号，那么您所要做的就是：

cut -d\" -f4 <in >out

获取一行中的第四个字段，并用"双引号分隔符分隔。

如果双引号可能会在该字符串中转义 - 例如通过反斜杠 - 那么你可以这样做：

sed 's/[^>]*."//;s/", ".*//'

...安全地只获取您想要的字段，而不会跳过任何内容，也不会出现误报。如果这些是唯一的引号字符，上面的两个替换应该可以很好地处理这个问题（不计算反斜杠）可以使用它，并且假设所有位都以raw这样的方式开始>并且在它之前没有>任何地方发生。

相关内容