使用 Rsync 以一种方式移动然后同步大量数据

Question 1

rsync --progress -av -e "ssh" /archive/images/ username@[serverIP-or-domainname]:/archive/images --dry-run

样本：

rsync --progress -av -e "ssh" /archive/images/ [email protected]:/archive/images --dry-run

这是假设两台机器上的目录都是 /archive/images，并且您已经设置了密钥，并且远程系统正在运行 sshd，我很确定它确实如此。

--dry-run对于查看该操作会做什么总是有用的，有助于避免讨厌的错误。

-v添加输出详细信息，这对于跟踪操作的位置很有用。

--delete从目标中删除源上不再存在的文件，如果要在远程系统上创建数据镜像，通常需要这样做。如果您的数据变化很大，您可能需要查看--delete-before、--delete-after、，--delete-during看看哪一个最能满足您的需求。我发现--delete通常工作得很好，但是对于 TiB 的数据，这可能很重要。--delete-before例如，如果您正在处理几乎已满的远程磁盘，则非常有用。

删除时要小心！！它将删除远程路径中在本地路径中找不到的所有内容，这意味着，如果您提供错误的路径，它会很高兴地开始删除或尝试删除该远程目录中的所有内容。--delete没有第一次就不要使用，--dry-run至少可以确保您没有犯错误！

-rtvz是比-a.我发现这个对于大多数应用程序来说已经足够了。

-a基本上创建了源的几乎真实的镜像（-aHAX大部分是完整的镜像）。-a/与(no , , )--archive相同。-rlptgoD-H-A-X

--progress显示作业运行时的进度，这很有用。

-e "ssh"正在执行 ssh，如果您需要在命令中使用更多 ssh 选项或其他选项（例如特定的 ssh 端口），那么这可能是一个更长的命令。样本：-e "ssh -p 423"

-z：如果您想降低 CPU 使用率，并且带宽没有太大变化（假设是图像等二进制文件），请删除-z压缩选项。

--bwlimit：如果您担心占用机器之间太多的网络带宽，则很有用，最小速度大小是 1k、1 KiB/s，可以是 1m、又名 1 MiB/s 等。如果您不这样做，这非常有用不想耗尽网络传输的所有带宽。正如 man 所说，请参阅--max-size不同单位的语法。

单位字符串的第一个字母可以是 B（字节[不适用于--bwlimit）、K (kilo)、M (mega)、G (giga)、T (tera) 或 P (peta)。如果字符串是单个字符或添加了“ib”（例如“G”或“GiB”），则单位是 1024 的倍数。如果使用以“B”结尾的两个字母后缀（例如"kb") 那么你得到的单位是 1000 的倍数。字符串的字母可以是你想要使用的大小写的任意组合。

--partial：如果您认为传输可能会中断，这很有用，这可以防止 rsync 在中断时默认删除部分传输。

请注意，第一次完全同步后，所有后续同步都会大大加快，因为仅更新更改的文件。一旦逻辑工作正常，您总是希望--delete在将来的同步中使用以保持本地和远程文件同步，删除已删除或重命名的文件等。在某些配置中，仅更新文件上已更改的数据，例如，如果该文件具有可以更改的元数据，但二进制核心数据不会更改，只有元数据部分会更改。不太适用于图像，但适用于其他数据类型，可以使同步速度提高 100 倍。

rsync 和 nfs

特别是如果使用 ext4，则通过 nfs 进行 rsync 将失败，因为它不支持所有文件系统属性（如果您要传输这些属性，就像在 -a 的情况下所做的那样）。它也很慢。 nfs 适合通过本地网络进行较小的传输，在这种情况下您不会遇到扩展文件属性问题，但我不会在生产中使用它。我曾经使用 rsync 通过 nfs 进行备份，当 ext4 出现时不得不停止，因为太多属性无法传输。

重新同步手册页

在使用这些系统时，没有什么比花一些时间阅读 rysnc 手册页更有用的了，例如，--partial直到今天我才意识到这是一件事，并且一直在努力应对非常大的文件传输中断并不得不重新开始下次启动时中断的文件。

不过，我不会粉饰这一点，尽管在我看来，rysnc 是有史以来最好的 cli 软件之一，但它的手册页很糟糕，急需重新组织，在其中找到东西太难了，我没有例如，直到今天阅读它之前，我什至知道其中的一些内容，例如，不知道--partial使我损失了数不清的时间，因为大文件传输中断而重新启动失败。

给 Andrew Tridgell 寄一份披萨，哈哈，当人们想付钱给他制作 rsync 时，这就是他所要求的，但更好的是，帮助修复手册页以使其更可用，将其分解为逻辑部分，这确实是阅读和使用时遇到困难。但它是优秀的文档，但没有经过很好的重组。

Answer

rsync --progress -av -e "ssh" /archive/images/ username@[serverIP-or-domainname]:/archive/images --dry-run

样本：

rsync --progress -av -e "ssh" /archive/images/ [email protected]:/archive/images --dry-run