我正在同一台机器上安装的不同驱动器上的两个 lzo 压缩 BtrFS 文件系统之间复制大量文件。文件似乎正在被解压缩/重新压缩。有没有办法避免这种情况?
答案1
事实并非如此,这取决于系统调用。举个例子:
open ("tuppence", O_RDONLY) = 3
fstat (3, {st_mode=S_IFREG|0644, st_size=15, ...}) = 0
open ("/tmp/tuppence", O_WRONLY|O_CREAT|O_EXCL, 0644) = 4
fstat (4, {st_mode=S_IFREG|0644, st_size=0, ...}) = 0
read (3, "I have cheese.\n", 32768) = 15
write (4, "I have cheese.\n", 15) = 15
(这是 strace 数据,为了清晰起见,进行了一些清理,是在复制文件时完成的。)
要将文件从 A 点复制到 B 点(尤其是跨挂载点),Linux 将调用read
要复制的文件,然后调用write
新文件。您可以在上面的跟踪中看到它。
- 打开源文件,得到文件描述符编号 3。
- 打开目标文件,得到文件描述符编号 4。
- 从描述符 3(源文件)读取。
- 将从3读入的数据写入目标文件描述符4中。
- 关闭所有东西。
系统read
调用请求文件供进程使用,从而触发 BTRFS 解压缩。然后将检索到的数据输入到调用中write
,这将触发目标上的 BTRFS 压缩。此行为是 Linux 文件系统层工作方式的基础。
要绕过此问题,请不要使用cp
。您必须使用专门用于 btrfs 的工具来处理完全在 btrfs 卷内移动的数据结构。问题是,我不知道是否存在这样的工具。
答案2
正如@sysadmin1138 所说明的那样,如果在文件系统中使用cp
/ rsync
/ send
- ,则无法避免此问题receive
;但在某些情况下有一种方法可以避免它。如果您使用种子设备,添加新设备(如 raid1),然后删除种子,您将获得与源基本相同的重复卷。(尽管 UUID 会发生变化。)
正如开发列表中指出的那样,“... 重复的卷本质上与源相同(该过程复制块),这意味着块配置文件也被保留。”
关于我的具体用例,我可以使用这种方法进行复制,将服务器安装到子卷中,然后将mv
文件复制过来。这样可以节省大量工作。