我想从日志文件中获取每小时的记录数。这是示例数据;
001:2017-05-23 00:00:01 002:10.10.10.63
001:2017-05-23 00:00:03 002:10.10.10.63
001:2017-05-23 00:00:05 002:10.10.10.63
001:2017-05-23 00:00:07 002:10.10.10.63
001:2017-05-23 00:00:09 002:10.10.10.63
001:2017-05-23 01:00:12 002:10.10.10.63
001:2017-05-23 01:00:14 002:10.10.10.63
从上面的数据输出应该是;
00 = 5
01 = 2
答案1
cut -f2 -d' ' logfile
| cut -f1 -d:
| sort
| uniq -c
| sed 's/ *\([0-9]\+\) \([0-9][0-9]\)/\2 = \1/'
| sort
- 仅输出时间。
- 仅提取小时数。
- 对输出进行排序-需要按以下行进行排序
- 统计每小时的发生次数,输出
count hour
- 修复格式
- 按小时排序
答案2
您可以按如下方式使用find
属性-printf
,我在日常操作中使用了这个:
find /path/ -type f -printf '%TY-%Tm-%Td-%TH\n' | sort | uniq -c
答案3
有很多解决方案,其中之一就是
log_file=/var/log/messages # log file for extract
d=2022-10-28 # start date
while [ "$d" != 2022-11-04 ]; do # loop for date range
echo $d # echo ACTUAL date
for h in {00..24}; do # loop for hours
act=$(date -d "$d" +'%b %d')" $h:" # create date for ACTUAL date in requested format: %b return month in Jan Feb..., %d return month number
echo $act # Print actual hour
grep "^$act" $log_file # grep $ACT from beginning of line of log_file and count lines
done
d=$(date -I -d "$d + 1 day") # add +1 day for start date to the main loop
done