posix_spawnp 在 Debian 9 上挂起直到子进程终止

Question

我查看了 glibc 2.24，它是 Debian 9 附带的。

posix_spawnp（和 posix_spawn）是作为用户模式 C 代码而不是系统调用实现的。它执行以下操作：

用旗帜制作一个管道O_CLOEXEC。
使用标志调用克隆CLONE_VFORK。 vfork 限制了子进程和父进程之间的通信——这就是管道发挥作用的地方。
父级关闭管道的写入端并尝试从读取端读取。
子进程关闭管道的读取端并执行所有文件操作。
孩子调用 execvp。如果成功，管道应该关闭。如果失败，子进程将向管道写入错误代码。
父级的读取返回。如果子进程中的 execvp 成功，则读取应该失败因为管道的写端应该已经关闭，父级将该变量设置ec为 0。如果读取成功，ec则是子级发送给它的错误代码。
父级中的 posix_spawnp 返回ec。

我把这些词用斜体表示，因为有一个错误。

当 posix_spawnp 执行所有这些posix_spawn_file_actions_addclose操作时，glibc 代码足够聪明，可以在看到影响该文件描述符的文件操作时对管道的写入端执行重复操作。

int p = args->pipe[1];
...
/* Dup the pipe fd onto an unoccupied one to avoid any file
   operation to clobber it.  */
if ((action->action.close_action.fd == p)
    || (action->action.open_action.fd == p)
    || (action->action.dup2_action.fd == p))
  {
    if ((ret = __dup (p)) < 0)
      goto fail;
    p = ret;
  }

问题是，重复不复制该O_CLOEXEC标志，因此 fd 会泄漏到子进程已执行的进程，并且在该进程退出之前不会关闭。在此之前，父级中的读取不会返回。

该错误已修复这次提交。现在，子级通过使用共享变量而不是管道将其成功或失败传达给父级。

如果您坚持使用这个版本的 glibc，除了不告诉 posix_spawnp 关闭管道的写入端（示例代码中可能是 logfd+2）之外，您无能为力。

Answer 1