绑定挂载上的“umount -R”需要花费不可忽略的时间，为什么？

Question

所以你认为umount花时间等待某事（因为它在或中花费很少的CPU时间user）sys。让我们找出它为什么等待......

# perf trace -g -e sched:* umount2 -R /mnt/a

perf record向我们展示了几个调度程序跟踪点；事实证明，最能说明问题的是sched:sched_switch。

Samples: 21  of event 'sched:sched_switch', Event count (approx.): 21
  Children      Self  Trace output                                                                                                                   ▒
-  100.00%   100.00%  umount:1888 [120] D ==> swapper/3:0 [120]                                                                                      ▒
     0                                                                                                                                               ▒
     __umount2                                                                                                                                       ▒
     entry_SYSCALL_64_fastpath                                                                                                                       ▒
     sys_umount                                                                                                                                      ▒
     do_umount                                                                                                                                       ▒
     namespace_unlock                                                                                                                                ▒
     synchronize_sched                                                                                                                               ▒
     __wait_rcu_gp                                                                                                                                   ▒
     wait_for_completion                                                                                                                             ▒
     schedule_timeout                                                                                                                                ▒
     schedule                                                                                                                                        ▒
     __schedule                                                                                                                                      ▒
     __schedule

__wait_rcu_gp()指 RCU 宽限期。 namespace_unlock()infs/namespace.c是某种形式的全局同步，其中包括synchronize_rcu().它等到全部“当前执行的 RCU 读端关键部分已完成”。 “RCU 宽限期延长了数毫秒……这种情况是在以读取为主的情况下使用 RCU 的经验法则的主要原因”。我认为挂载命名空间被认为是“主要读取”。

看来这“几毫秒”占了 34 次调用中每次平均等待时间 5 毫秒的原因umount2()。

Answer 1

所以你认为umount花时间等待某事（因为它在或中花费很少的CPU时间user）sys。让我们找出它为什么等待......

# perf trace -g -e sched:* umount2 -R /mnt/a

perf record向我们展示了几个调度程序跟踪点；事实证明，最能说明问题的是sched:sched_switch。

Samples: 21  of event 'sched:sched_switch', Event count (approx.): 21
  Children      Self  Trace output                                                                                                                   ▒
-  100.00%   100.00%  umount:1888 [120] D ==> swapper/3:0 [120]                                                                                      ▒
     0                                                                                                                                               ▒
     __umount2                                                                                                                                       ▒
     entry_SYSCALL_64_fastpath                                                                                                                       ▒
     sys_umount                                                                                                                                      ▒
     do_umount                                                                                                                                       ▒
     namespace_unlock                                                                                                                                ▒
     synchronize_sched                                                                                                                               ▒
     __wait_rcu_gp                                                                                                                                   ▒
     wait_for_completion                                                                                                                             ▒
     schedule_timeout                                                                                                                                ▒
     schedule                                                                                                                                        ▒
     __schedule                                                                                                                                      ▒
     __schedule

__wait_rcu_gp()指 RCU 宽限期。 namespace_unlock()infs/namespace.c是某种形式的全局同步，其中包括synchronize_rcu().它等到全部“当前执行的 RCU 读端关键部分已完成”。 “RCU 宽限期延长了数毫秒……这种情况是在以读取为主的情况下使用 RCU 的经验法则的主要原因”。我认为挂载命名空间被认为是“主要读取”。

看来这“几毫秒”占了 34 次调用中每次平均等待时间 5 毫秒的原因umount2()。

绑定挂载上的“umount -R”需要花费不可忽略的时间，为什么？

进一步测试

答案1

相关内容