在执行期间修改二进制文件

Question 1

虽然 Stack Overflow 问题一开始似乎已经足够了，但从你的评论中我明白为什么你可能仍然对此有疑问。对我来说，这正是这样的危急时刻当两个 UNIX 子系统（进程和文件）通信时涉及到。

您可能知道，UNIX 系统通常分为两个子系统：文件子系统和进程子系统。现在，除非通过系统调用另有指示，否则内核不应让这两个子系统相互交互。然而有一个例外：将可执行文件加载到进程中'文本区域。当然，有人可能会说这个操作也是由系统调用（execve）触发的，但这通常被认为是一进程子系统向文件子系统发出隐式请求的情况。

因为进程子系统自然无法处理文件（否则将整个事情分成两部分就没有意义），所以它必须使用文件子系统提供的任何内容来访问文件。这也意味着进程子系统将服从文件子系统针对文件编辑/删除采取的任何措施。关于这一点，我建议阅读吉尔斯的回答到这个 U&L 问题。我的其余答案基于吉尔斯的这一更笼统的答案。

首先应该注意的是，在内部，文件只能通过索引节点。如果给内核一个路径，它的第一步将是将其转换为用于所有其他操作的索引节点。当进程将可执行文件加载到内存中时，它通过其索引节点来执行此操作，该索引节点是在路径转换后由文件子系统提供的。索引节点可能与多个路径（链接）相关联，并且程序只能删除链接。为了删除文件及其索引节点，用户态必须删除该索引节点的所有现有链接，并确保它完全未使用。当满足这些条件时，内核将自动从磁盘删除该文件。

如果你看一下替换可执行文件吉尔斯答案的一部分，你会看到这取决于你如何编辑/删除对于文件，内核将以不同的方式做出反应/适应，始终通过文件子系统内实现的机制。

如果您尝试策略一（打开/截断为零/写入或者打开/写入/截断到新大小），你会发现内核不会费心处理你的请求。你会得到一个错误 26：文本文件忙( ETXTBSY)。没有任何后果。
如果您尝试策略二，第一步是删除可执行文件。然而，由于它正在被进程使用，文件子系统将启动并阻止文件（及其索引节点）被确实从磁盘中删除。从这一点来看，访问旧文件内容的唯一方法是通过其 inode 来完成，这就是进程子系统每当需要将新数据加载到其中时所做的事情文本部分（在内部，使用路径是没有意义的，除非将它们转换为索引节点）。即使你已经未链接的文件（删除了它的所有路径），该进程仍然可以使用它，就好像您什么也没做一样。使用旧路径创建新文件不会改变任何内容：新文件将被赋予一个全新的索引节点，而正在运行的进程对此一无所知。

策略 2 和 3 对于可执行文件也是安全的：尽管运行的可执行文件（和动态加载的库）在具有文件描述符的意义上不是打开文件，但它们的行为方式非常相似。只要某个程序正在运行该代码，即使没有目录条目，该文件也会保留在磁盘上。

策略三非常相似，因为该mv操作是原子操作。这可能需要使用rename系统调用，并且由于进程在内核模式下无法中断，因此在完成（成功与否）之前没有任何东西可以干扰此操作。同样，旧文件的 inode 没有更改：创建了一个新文件，并且已在运行的进程不会知道它，即使它已与旧 inode 的链接之一关联。

使用策略 3，将新文件移动到现有名称的步骤会删除通向旧内容的目录条目，并创建通向新内容的目录条目。这是在一个原子操作中完成的，因此该策略具有一个主要优点：如果进程在任何时候打开文件，它将看到旧内容或新内容 - 不存在获得混合内容或文件不存在的风险。现存的。

重新编译文件：使用时gcc（对于许多其他编译器的行为可能类似），您正在使用策略 2。您可以通过运行strace编译器的一个进程来看到这一点：

stat("a.out", {st_mode=S_IFREG|0750, st_size=8511, ...}) = 0
unlink("a.out") = 0
open("a.out", O_RDWR|O_CREAT|O_TRUNC, 0666) = 3
chmod("a.out", 0750) = 0

编译器通过stat和lstat系统调用检测到该文件已经存在。
该文件是未链接的。在这里，虽然不再可以通过 name 访问它a.out，但只要已在运行的进程正在使用它们，它的 inode 和内容就会保留在磁盘上。
创建一个新文件并以名称赋予可执行权限a.out。这是一个全新的 inode 和全新的内容，已运行的进程无需关心这些内容。

现在，当涉及到共享库时，同样的行为也将适用。只要一个库对象被进程使用，它就不会从磁盘中删除，无论您如何更改其链接。每当需要将某些内容加载到内存中时，内核都会通过文件的索引节点来完成此操作，因此会忽略对其链接所做的更改（例如将它们与新文件关联）。

Answer

虽然 Stack Overflow 问题一开始似乎已经足够了，但从你的评论中我明白为什么你可能仍然对此有疑问。对我来说，这正是这样的危急时刻当两个 UNIX 子系统（进程和文件）通信时涉及到。