用户命名空间：如何仅为给定程序安装文件夹

Question 1

您正在阅读的教程是在 2013 年创建的，之前添加了一个重要的附加限制来处理全局ID2015 年内核 3.19 中的映射。man user_namespaces：

写“否认”到/proc/[pid]/setgroups写入之前的文件 /proc/[pid]/gid_map 将要在用户命名空间中永久禁用 setgroups(2) 并允许在父用户命名空间中不具有 CAP_SETGID 功能的情况下写入 /proc/[pid]/gid_map。

这/proc/[pid]/setgroupsLinux 3.19 中添加了该文件，但被向后移植到许多早期的稳定内核系列，因为它解决了安全问题。该问题涉及具有“rwx---rwx”等权限的文件。此类文件对“组”的权限比对“其他”的权限要少。这意味着使用 setgroups(2) 删除组可能会允许以前没有的进程文件访问权限。在用户名称空间存在之前，这不是一个问题 [...] 这允许以前的非特权用户删除组，从而获得他们以前没有的文件访问权限。 [...]

因此，您必须添加代码以将单词写入deny名称snprintf(map_path, PATH_MAX, "/proc/%ld/setgroups", (long) child_pid);正确的文件，然后再写入gid_map.

整个代码可以用这个普遍存在的命令替换：

unshare --user --map-root-user --mount -- bash

（其中有一个隐含的--setgroups=deny）

同样，如果没有特权，则只能映射一个 uid/gid。因此，一旦挂载完成，模拟原始用户的唯一可能选择（尽管不完全）就是映射回原始用户，这可以使用最新版本的unshareToo 以及刚刚未共享的第二个级联用户命名空间来完成：

# unshare --user --map-user=1000 --map-group=100 -- bash

那么这个命名空间中将会有一个 uid。甚至 root 也不再存在（并且被视为与nobody任何其他未映射的 uid 一样映射）。

笔记

还有与其他命名空间和功能的其他交互，这是一个例子：

保留CAP_SYS_ADMIN拥有进程 PID 命名空间的用户命名空间允许（自 Linux 3.8 起）该进程挂载/进程 文件系统。

因此，添加--pid --fork以遵守上述限制允许/proc在以后需要时安装到现有的限制上，但通常仅在--pid第一次使用时才需要（并且也可以通过添加来方便地完成--mount-proc）。

由于与网络命名空间的交互，同样--net需要挂载。/sys

将所有这些放在一起替换为as/lib的内容/tmp/oOP的例子：

unshare --user --map-root-user --mount -- \
    sh -c 'mount --bind /tmp/o /lib; exec unshare --user --map-user=1000 --map-group=100 -- bash'

注意：一旦完成第一次映射，就不可能再正确使用大多数特权命令：要么在用户命名空间中存在单个 UID 0 可用，要么在下一个（嵌套）用户命名空间中存在单个 UID 1000 可用。由于特权命令处理两个 UID（其中之一通常是 root）和一个不可用的 UID 之间的转换，因此通常会在某些带有 EINVAL 的系统调用中失败。

为了做得更好，首先需要特权命令的帮助，并需要 root 访问权限来配置其他权限。例如 setuid root 命令newuidmap和newgidmap通常需要从没有权限的用户引导完整的容器。

Answer