具有非常大输出的管道命令

Question 1

当数据生产者 ( tar) 尝试太快地写入管道以使消费者 ( lzip) 没有时间读取所有数据时，它将堵塞直到lzip有时间阅读tar所写的内容。有一个与管道关联的小缓冲区，但其大小可能小于大多数tar档案的大小。不存在管道填满系统 RAM 的风险。

“阻塞”只是意味着当tar调用库函数（或等效函数）时，调用不会返回，直到数据被传递到管道缓冲区，如果读取速度很慢，write()这可能需要一些时间lzip相同的缓冲区。您应该能够在与相比（假设实际上比更快）的top地方看到这一点，其中tar会减慢速度并睡眠很多。lziptarlzip

因此你会不是使用管道填充大量 RAM。为此（如果您愿意），您可以pv在中间使用类似的东西，并带有一些大缓冲区（此处为千兆字节）：

tar -cvf - /tmp/source-dir | pv --buffer-size 1G | lzip -o /media/my-usb/result.lz -

tar无论何时pv阻塞，这仍然会阻塞。pv当缓冲区已满且无法写入时会阻塞lzip。

相反的情况以类似的方式工作，即，如果管道的左侧缓慢写入右侧快速，则右侧的消费者将阻塞，read()直到有数据可从管道读取。

这（数据 I/O）是唯一同步参与管道的进程的东西。除了读取和写入（偶尔会在等待其他人读取或写入时发生阻塞）之外，它们将彼此独立运行。

Answer

当数据生产者 ( tar) 尝试太快地写入管道以使消费者 ( lzip) 没有时间读取所有数据时，它将堵塞直到lzip有时间阅读tar所写的内容。有一个与管道关联的小缓冲区，但其大小可能小于大多数tar档案的大小。不存在管道填满系统 RAM 的风险。

“阻塞”只是意味着当tar调用库函数（或等效函数）时，调用不会返回，直到数据被传递到管道缓冲区，如果读取速度很慢，write()这可能需要一些时间lzip相同的缓冲区。您应该能够在与相比（假设实际上比更快）的top地方看到这一点，其中tar会减慢速度并睡眠很多。lziptarlzip