如何从日志文件中提取多个子字符串

Question

假设所有行的 URL 格式相同，则可以使用sed以下命令获取时间戳和数字字符串：

$ sed -r 's|.*\[(.*)\].*=%(.*)&sub.*|\1 \2|g' /var/log/httpd/access_log
16/Dec/2014:06:27:30 +0100 2B2341231231234

该表达式采用[和内部存在的任何内容]（应为时间戳）以及=%和之间存在的任何内容&sub（应为数字字符串）。

Answer 1

假设所有行的 URL 格式相同，则可以使用sed以下命令获取时间戳和数字字符串：

$ sed -r 's|.*\[(.*)\].*=%(.*)&sub.*|\1 \2|g' /var/log/httpd/access_log
16/Dec/2014:06:27:30 +0100 2B2341231231234

该表达式采用[和内部存在的任何内容]（应为时间戳）以及=%和之间存在的任何内容&sub（应为数字字符串）。

相关内容