我有一大堆线程转储,它们位于目录树中(每 30 分钟一个文件夹)。
我正在尝试计算单个文件中有多少个线程。到目前为止我已经想出了:
find . -name 'high-cpu-tdump.out' -exec grep -H "Thread-" {} \;
这返回:
./cbsmtjfuprd2/2021.10.22-06.30/high-cpu-tdump.out:"Thread-0 (HornetQ-server-HornetQServerImpl::serverUUID=7582b137-83b1-11e9-bc0d-b5863efb47a2-961209098)" #123 prio=5 os_prio=0 tid=0x00007f01a45be000 nid=0x4a4 waiting on condition [0x00007f010b730000]
./cbsmtjfuprd2/2021.10.22-06.30/high-cpu-tdump.out:"Thread-1 (HornetQ-scheduled-threads-2107959528)" #121 prio=5 os_prio=0 tid=0x00007f01c01ff800 nid=0x4a2 waiting on condition [0x00007f0130897000]
./cbsmtjfuprd2/2021.10.22-06.30/high-cpu-tdump.out:"Thread-0 (HornetQ-Asynchronous-Persistent-Writes221963927-1847608919)" #120 daemon prio=5 os_prio=0 tid=0x00007f01a4527000 nid=0x49a waiting on condition [0x00007f0131487000]
./cbsmtjfuprd2/2021.10.22-06.30/high-cpu-tdump.out:"Thread-0 (HornetQ-scheduled-threads-2107959528)" #116 prio=5 os_prio=0 tid=0x00007f01a4377800 nid=0x490 waiting on condition [0x00007f0131ce4000]
. . . . . .
这是一个好的开始,但是我需要用“wc -l”链接它,以便我知道每个文件中有多少个线程。我正在做一些尝试,但都失败了:
find . -name 'high-cpu-tdump.out' -exec grep -H "Thread-" {} | wc -l \;
find: missing argument to `-exec'
您是否知道它是否可以与 find 一起使用,还是我必须编写一个脚本来逐个检查每个文件的目录?
答案1
如果不使用ie 的显式 shell 调用,则无法通过管道wc -l
将grep
命令作为 的一部分-exec
sh -c
find . -name 'high-cpu-tdump.out' -exec sh -c 'grep -H "Thread-" {} | wc -l' ';'
但运行这个确实不是生成在其中找到模式的文件名。为了可靠地做到这一点,建议在内部使用 shell 循环sh -c
来打印文件名和相关字数
find . -name 'high-cpu-tdump.out' -exec sh -c '
for file; do printf "%s %s\n" "file" $(grep -c "Thread-" "$file") ; done' -- {} +
或者grep
单独使用而不使用 find,利用--include
允许提供 glob 表达式以在递归时仅搜索这些文件的标志(GNU/BSD 变体)
grep -r -c 'Thread-' --include='high-cpu-tdump.out' .
我建议也使用ripgrep默认情况下,它以递归方式 grep 查找文件,并且速度更快(来源)。你可以在其中做
rg -c 'Thread-' -g 'high-cpu-tdump.out'