我的系统的目录中有大量文件
$ ls -god xml
drwxrwsrwx 7 7070720 Mar 12 11:51 xml
如果我尝试使用ls xml/*query | wc -l
系统计算特定的文件组通常会产生错误消息
/bin/ls: arg list too long
我尝试过find xml -name '*query' | wc -l
10 分钟后没有任何响应,此时我终止了命令。
$ nohup time find xml -name '*query' -level 0 | wc -l &
[1] 11751
$ ps -f 2>rgb
UID PID PPID C STIME TTY TIME CMD
rgb 11751 10637 0 02:45:11 ttyp12 00:00:00 wc -l
rgb 11752 11751 0 02:45:11 ttyp12 00:00:00 time find xml -name *query -level 0
rgb 11753 11752 77 02:45:11 ttyp12 00:00:03 find xml -name *query -level 0
rgb 11776 10637 1 02:45:17 ttyp12 00:00:00 ps -f
rgb 10583 10581 0 02:30:13 ttyp12 00:00:00 -csh
rgb 10637 10583 2 02:30:19 ttyp12 00:00:00 ksh
top -Urgb
last pid: 11864; load averages: 1.21, 0.82, 0.66 14:48:03
249 processes: 246 sleeping, 2 running, 1 onproc
CPU states: 0.0% idle, 24.5% user, 75.5% system, 0.0% wait, 0.0% sxbrk
Memory: 2048M phys, 1799M max, 1718M free, 1774M locked, 114M unlocked, K swap
PID USERNAME PRI NICE SIZE RES STATE TIME COMMAND
11837 rgb 26 0 804K 804K onpr 0:00 top
11753 rgb 56 4 5512K 5512K run 1:10 find
11751 rgb 51 4 588K 588K sleep 0:00 wc
10583 rgb 48 0 1204K 1204K sleep 0:00 -csh
11752 rgb 48 4 588K 588K sleep 0:00 time
10637 rgb 48 0 1288K 1288K sleep 0:00 ksh
last pid: 12330; load averages: 1.82, 1.45, 1.05 14:58:06
258 processes: 253 sleeping, 4 running, 1 onproc
CPU states: 0.0% idle, 20.7% user, 78.7% system, 0.6% wait, 0.0% sxbrk
Memory: 2048M phys, 1799M max, 1711M free, 1774M locked, 106M unlocked, K swap
PID USERNAME PRI NICE SIZE RES STATE TIME COMMAND
11837 rgb 26 0 804K 804K onpr 0:00 top
11753 rgb -1 4 5512K 5512K run 5:10 find
11751 rgb 51 4 588K 588K sleep 0:00 wc
10583 rgb 48 0 1204K 1204K sleep 0:00 -csh
11752 rgb 48 4 588K 588K sleep 0:00 time
10637 rgb 48 0 1288K 1288K sleep 0:00 ksh
$ jobs
[1] + Running nohup time find xml -name '*query' -level 0 | wc -l &
$ kill %1
[1] + Terminated nohup time find xml -name '*query' -level 0 | wc -l &
我可以替换目录大小 7070720 中的文件数量(例如 10% 以内)吗由 给出ls -god xml
?
补充问题:这在多大程度上取决于文件系统(UFS、V7FS、HTFS 等)?
更新:
该命令ls xml | wc -l
确实在几秒钟内返回了一个值。我应该在发布问题之前尝试一下。这提供了我所要求的信息,因此没有必要计算 7070720 字节目录中包含多少个文件名+inode 条目(答案:至少 260085)。
答案1
ls
对输出进行排序会浪费资源。如果您有 GNU ls
,请执行以下操作:
ls --quoting-style=escape -U xml | wc -l
答案2
n=0; for file in ./*; do let "n += 1"; done; echo $n;
答案3
做
set -- *
echo $#
工作?由于set
是内置的 shell,因此它可能不受 arg 限制的影响。请注意,这会忽略点文件。通过更具选择性的 glob,您可能会得到您所需要的东西。这样做的好处是它不需要一个叉子或管子。
答案4
这个命令如何通过管道传输未排序的目录列表并计算匹配项:
$ ls -U ./xml/ | grep -c 'query$'
请注意,根据您对 *nix 的喜好,您可能需要ls -u
而不是ls -U