从 Web 日志文件中提取字符串

Question 1

你最好使用 awk ，

awk '{print $1,$4,$5;}' test.log

awk按间距分解每行，让您将字段称为$1、$2、... 等，然后只需打印第一个、第四个和第五个字段（$4并$5组成日期戳）。

Answer

你最好使用 awk ，

awk '{print $1,$4,$5;}' test.log

awk按间距分解每行，让您将字段称为$1、$2、... 等，然后只需打印第一个、第四个和第五个字段（$4并$5组成日期戳）。

Question 2

在中使用 RE 替换sed，这里\1, , ... 被分配相应和\2之间的值

sed 's/\([0-9\.]\) - - \[\(.*\)\] "GET .*/\1, \2/' test.log

（当然您可以在括号中替换更精确的模式）

Answer

在中使用 RE 替换sed，这里\1, , ... 被分配相应和\2之间的值

sed 's/\([0-9\.]\) - - \[\(.*\)\] "GET .*/\1, \2/' test.log

（当然您可以在括号中替换更精确的模式）

Question 3

通过 unix 命令，您可以使用以下命令sed

sed -e 's/\(\([0-9]\{1,3\}\.\)\{3\}[0-9]\{1,3\}\).*\[\(.*\)\].*/\1\t\3/' test.log

但如果日志文件非常大，我认为最好使用Python，因为它可以使用fileinput库或生成器更有效地处理大文件上的操作。

Answer

通过 unix 命令，您可以使用以下命令sed

sed -e 's/\(\([0-9]\{1,3\}\.\)\{3\}[0-9]\{1,3\}\).*\[\(.*\)\].*/\1\t\3/' test.log

但如果日志文件非常大，我认为最好使用Python，因为它可以使用fileinput库或生成器更有效地处理大文件上的操作。

相关内容