加速复制1000000个小文件

Question 1

假如说

返回的条目readdir不按 inode 号排序
按 inode 顺序读取文件减少了查找操作的次数
大多数文件的内容都在初始 8k 分配中（ext4 优化），这也应该产生更少的查找操作

您可以尝试通过按 inode 顺序复制文件来加快复制速度。

这意味着使用这样的东西：

$ cd /mnt/src
$ ls -U -i | sort -k1,1 -n | cut -d' ' -f2- > ~/clist
$ xargs cp -t /mnt2/dst < ~/clist

Answer

假如说

返回的条目readdir不按 inode 号排序
按 inode 顺序读取文件减少了查找操作的次数
大多数文件的内容都在初始 8k 分配中（ext4 优化），这也应该产生更少的查找操作

您可以尝试通过按 inode 顺序复制文件来加快复制速度。

这意味着使用这样的东西：

$ cd /mnt/src
$ ls -U -i | sort -k1,1 -n | cut -d' ' -f2- > ~/clist
$ xargs cp -t /mnt2/dst < ~/clist

Question 2

tar按照传统， GNUpax自行处理硬链接。

cd "$srcdir" ; tar --hard-dereference -cf - ./* |
    tar -C"${tgtdir}" -vxf -

这样你就只有两个tar进程，并且不需要cp一遍又一遍地调用。

Answer

tar按照传统， GNUpax自行处理硬链接。

cd "$srcdir" ; tar --hard-dereference -cf - ./* |
    tar -C"${tgtdir}" -vxf -

这样你就只有两个tar进程，并且不需要cp一遍又一遍地调用。

Question 3

类似地@maxschlepzig 的答案，您可以解析的输出，filefrag按照文件的第一个片段出现在磁盘上的顺序对文件进行排序：

find . -maxdepth 1 -type f |
  xargs -d'\n' filefrag -v |
  sed -n '
    /^   0:        0../ {
      s/^.\{28\}\([0-9][0-9]*\).*/\1/
      h
      }
    / found$/ {
      s/:[^:]*$//
      H
      g
      s/\n/ /p
      }' |
    sort -nk 1,1 |
    cut -d' ' -f 2- |
    cpio -p dest_dir

MMV 带有上面的sed脚本，所以一定要彻底测试。

否则，无论您做什么，filefrag（的一部分）的使用速度都会比它可以采用多个文件参数e2fsprogs快得多。hdparm仅仅运行 1,000,000 次的开销hdparm就会增加很多开销。

perl此外，编写一个脚本（或 C 程序），为FIEMAP ioctl每个文件创建一个应复制的块和所属文件的排序数组，然后按顺序复制所有内容可能不会那么困难从相应的文件中读取每个块的大小（但要注意不要用完文件描述符）。

Answer

类似地@maxschlepzig 的答案，您可以解析的输出，filefrag按照文件的第一个片段出现在磁盘上的顺序对文件进行排序：

find . -maxdepth 1 -type f |
  xargs -d'\n' filefrag -v |
  sed -n '
    /^   0:        0../ {
      s/^.\{28\}\([0-9][0-9]*\).*/\1/
      h
      }
    / found$/ {
      s/:[^:]*$//
      H
      g
      s/\n/ /p
      }' |
    sort -nk 1,1 |
    cut -d' ' -f 2- |
    cpio -p dest_dir

MMV 带有上面的sed脚本，所以一定要彻底测试。

否则，无论您做什么，filefrag（的一部分）的使用速度都会比它可以采用多个文件参数e2fsprogs快得多。hdparm仅仅运行 1,000,000 次的开销hdparm就会增加很多开销。

perl此外，编写一个脚本（或 C 程序），为FIEMAP ioctl每个文件创建一个应复制的块和所属文件的排序数组，然后按顺序复制所有内容可能不会那么困难从相应的文件中读取每个块的大小（但要注意不要用完文件描述符）。

加速复制1000000个小文件

答案1

答案2

答案3

相关内容