为什么echo >file比echo | 使用更实时sed>文件?

为什么echo >file比echo | 使用更实时sed>文件?

下面的例子让我感到惊讶。这似乎是违反直觉的......除了事实上还有一个胡须更多用户时间对于echo | sed组合。

为什么echo用这么多系统时间当它单独运行时,或者问题应该是,如何sed改变游戏状态?似乎echo需要做同样的事情回声在这两种情况下...

time echo -n a\ {1..1000000}\ c$'\n' >file

# real    0m9.481s
# user    0m5.304s
# sys     0m4.172s

time echo -n a\ {1..1000000}\ c$'\n' |sed s/^\ // >file

# real    0m5.955s
# user    0m5.488s
# sys     0m1.580s

答案1

bahamat 和 Alan Curry 说得对:这是由于 shell 缓冲echo.具体来说,您的 shell 是 bash,它write每行发出一个系统调用。因此,第一个片段对磁盘文件进行了 1000000 次写入,而第二个片段对管道进行了 1000000 次写入,而 sed (如果您有多个 CPU,则主要是并行的)由于其输出,对磁盘文件的写入次数要少得多缓冲。

您可以通过运行来观察发生了什么斯特雷斯

$ strace -f -e write bash -c 'echo -n a\ {1..2}\ c$'\'\\n\'' >file'
write(1, "a 1 c\n", 6)                  = 6
write(1, " a 2 c\n", 7)                 = 7
$ strace -f -e write bash -c 'echo -n a\ {1..2}\ c$'\'\\n\'' | sed "s/^ //" >file'
Process 28052 attached
Process 28053 attached
Process 28051 suspended
[pid 28052] write(1, "a 1 c\n", 6)      = 6
[pid 28052] write(1, " a 2 c\n", 7)     = 7
Process 28051 resumed
Process 28052 detached
Process 28051 suspended
[pid 28053] write(1, "a 1 c\na 2 c\n", 12) = 12
Process 28051 resumed
Process 28053 detached
--- SIGCHLD (Child exited) @ 0 (0) ---

其他 shell(例如 ksh)即使在多行情况下也会缓冲输出echo,因此您不会看到太大的差异。

$ strace -f -e write ksh -c 'echo -n a\ {1..2}\ c$'\'\\n\'' >file'
write(1, "a 1 c\n a 2 c\n", 13)         = 13
$ strace -f -e write ksh -c 'echo -n a\ {1..2}\ c$'\'\\n\'' | sed "s/^ //" >file'
Process 28058 attached
[pid 28058] write(1, "a 1 c\n a 2 c\n", 13) = 13
Process 28058 detached
--- SIGCHLD (Child exited) @ 0 (0) ---
write(1, "a 1 c\na 2 c\n", 12)          = 12

使用 bash 我得到了类似的时间比率。使用 ksh,我看到第二个片段运行得更慢。

ksh$ time echo -n a\ {1..1000000}\ c$'\n' >file

real    0m1.44s
user    0m1.28s
sys     0m0.06s
ksh$ time echo -n a\ {1..1000000}\ c$'\n' | sed "s/^ //" >file

real    0m2.38s
user    0m1.52s
sys     0m0.14s

相关内容