确定目录中的文件数量而不计算它们

2024-5-18 • tag-icon

我的系统的目录中有大量文件

 $ ls -god xml
 drwxrwsrwx   7 7070720 Mar 12 11:51 xml

如果我尝试使用ls xml/*query | wc -l 系统计算特定的文件组通常会产生错误消息

 /bin/ls: arg list too long

我尝试过find xml -name '*query' | wc -l10 分钟后没有任何响应，此时我终止了命令。

$ nohup time find xml -name '*query' -level 0 | wc -l &
[1]     11751

$ ps -f 2>rgb
     UID   PID  PPID  C    STIME     TTY        TIME CMD
     rgb 11751 10637  0 02:45:11  ttyp12    00:00:00 wc -l
     rgb 11752 11751  0 02:45:11  ttyp12    00:00:00 time find xml -name *query -level 0
     rgb 11753 11752 77 02:45:11  ttyp12    00:00:03 find xml -name *query -level 0
     rgb 11776 10637  1 02:45:17  ttyp12    00:00:00 ps -f
     rgb 10583 10581  0 02:30:13  ttyp12    00:00:00 -csh
     rgb 10637 10583  2 02:30:19  ttyp12    00:00:00 ksh

top -Urgb

last pid: 11864;  load averages:  1.21,  0.82,  0.66                   14:48:03
249 processes: 246 sleeping, 2 running, 1 onproc
CPU states:  0.0% idle, 24.5% user, 75.5% system,  0.0% wait,  0.0% sxbrk
Memory: 2048M phys, 1799M max, 1718M free, 1774M locked, 114M unlocked, K swap

  PID USERNAME PRI NICE   SIZE   RES  STATE   TIME  COMMAND
11837 rgb       26    0   804K   804K onpr    0:00  top
11753 rgb       56    4  5512K  5512K run     1:10  find
11751 rgb       51    4   588K   588K sleep   0:00  wc
10583 rgb       48    0  1204K  1204K sleep   0:00  -csh
11752 rgb       48    4   588K   588K sleep   0:00  time
10637 rgb       48    0  1288K  1288K sleep   0:00  ksh

last pid: 12330;  load averages:  1.82,  1.45,  1.05                   14:58:06
258 processes: 253 sleeping, 4 running, 1 onproc
CPU states:  0.0% idle, 20.7% user, 78.7% system,  0.6% wait,  0.0% sxbrk
Memory: 2048M phys, 1799M max, 1711M free, 1774M locked, 106M unlocked, K swap

  PID USERNAME PRI NICE   SIZE   RES  STATE   TIME  COMMAND
11837 rgb       26    0   804K   804K onpr    0:00  top
11753 rgb       -1    4  5512K  5512K run     5:10  find
11751 rgb       51    4   588K   588K sleep   0:00  wc
10583 rgb       48    0  1204K  1204K sleep   0:00  -csh
11752 rgb       48    4   588K   588K sleep   0:00  time
10637 rgb       48    0  1288K  1288K sleep   0:00  ksh

$ jobs
[1] +  Running                 nohup time find xml -name '*query' -level 0 | wc -l &

$ kill %1
[1] + Terminated               nohup time find xml -name '*query' -level 0 | wc -l &

我可以替换目录大小 7070720 中的文件数量（例如 10% 以内）吗由给出ls -god xml?

补充问题：这在多大程度上取决于文件系统（UFS、V7FS、HTFS 等）？

更新：

该命令ls xml | wc -l确实在几秒钟内返回了一个值。我应该在发布问题之前尝试一下。这提供了我所要求的信息，因此没有必要计算 7070720 字节目录中包含多少个文件名+inode 条目（答案：至少 260085）。

答案1

ls对输出进行排序会浪费资源。如果您有 GNU ls，请执行以下操作：

ls --quoting-style=escape -U xml | wc -l

答案2

n=0; for file in ./*; do let "n += 1"; done; echo $n;

答案3

做

set -- *
echo $#

工作？由于set是内置的 shell，因此它可能不受 arg 限制的影响。请注意，这会忽略点文件。通过更具选择性的 glob，您可能会得到您所需要的东西。这样做的好处是它不需要一个叉子或管子。

答案4

这个命令如何通过管道传输未排序的目录列表并计算匹配项：

$ ls -U ./xml/ | grep -c 'query$'

请注意，根据您对 *nix 的喜好，您可能需要ls -u而不是ls -U

答案1

答案2

答案3

答案4

相关内容