内核的哪些部分不支持命名空间？

Question 1

一个漏洞，但不是您提到的类型。

可以创建和运行任意 docker 容器的用户可以创建具有主机文件系统映射部分的容器。然后，他们可以在容器中以 root 身份运行，在磁盘上创建 setuid root 程序。然后，他们可以从主机运行此命令以获得 root 权限。

Answer

一个漏洞，但不是您提到的类型。

可以创建和运行任意 docker 容器的用户可以创建具有主机文件系统映射部分的容器。然后，他们可以在容器中以 root 身份运行，在磁盘上创建 setuid root 程序。然后，他们可以从主机运行此命令以获得 root 权限。

Question 2

这是一个很好但很难回答的问题，因为它非常开放。

重点关注“代码可能在根命名空间中执行”部分，这取决于“代码”的含义：

上面#2 的意思是它们通过每个进程的抽象来感知命名空间。即，它们在进程表中的条目直接或间接地指向命名空间部分（例如根文件系统）。从那时起，只要内核端的某些功能正常工作，它就应该是“隔离的”，因为它始终会访问正确的数据集。

然而，这并不意味着错误不能影响正在运行的系统的所有方面，包括其他容器。

如果您想在隔离系统中运行某些东西，那么您需要一个完整的虚拟机或用户空间 Linux。容器旨在隔离进程及其所看到和可以访问的内容。当出现错误时，他们可以超越限制，就像正常进程最终可以以 root 身份运行代码一样。

[1] 几乎所有与系统有关的事情都是使用系统调用完成的。例如打开文件、写入套接字、发送信号等。