虚拟内存与进程的虚拟地址空间有关吗？

Question 1

虚拟内存和分页不应与页面文件（也称为交换文件）
这两个概念确实是有联系的，但是还是有区别的。

虚拟内存是指进程的虚拟地址空间：每个进程都“认为”它有一个专用的 32 位（或 64 位）地址空间，但实际上并没有——可能有些页面没有实际上存在于内存中，或者可能存在于不同的物理地址，但进程并不关心。

这方法实现这一点的方法称为分页：每当进程访问内存时，内存管理单元都会通过查找物理页面RAM 对应于虚拟页面内存。（页面是内存管理的较大单位，通常为 4KiB）。如果不存在映射，则会触发页面错误，让操作系统知道。

此时，操作系统决定接下来要做什么。它可以终止程序，可以随机生成数据（！），也可以将数据存储或从页面文件（或者交换文件) 在另一个存储设备上。但此时，硬件并不关心会发生什么——操作系统可以做随心所欲处理请求时。

因此，虚拟内存和页面文件不是本质上是相关的，但它们恰好在典型情况下齐头并进。

Answer

虚拟内存和分页不应与页面文件（也称为交换文件）
这两个概念确实是有联系的，但是还是有区别的。

虚拟内存是指进程的虚拟地址空间：每个进程都“认为”它有一个专用的 32 位（或 64 位）地址空间，但实际上并没有——可能有些页面没有实际上存在于内存中，或者可能存在于不同的物理地址，但进程并不关心。

这方法实现这一点的方法称为分页：每当进程访问内存时，内存管理单元都会通过查找物理页面RAM 对应于虚拟页面内存。（页面是内存管理的较大单位，通常为 4KiB）。如果不存在映射，则会触发页面错误，让操作系统知道。

此时，操作系统决定接下来要做什么。它可以终止程序，可以随机生成数据（！），也可以将数据存储或从页面文件（或者交换文件) 在另一个存储设备上。但此时，硬件并不关心会发生什么——操作系统可以做随心所欲处理请求时。

因此，虚拟内存和页面文件不是本质上是相关的，但它们恰好在典型情况下齐头并进。

Question 2

我们以 32 位 x86 CPU 为例，为了便于说明，我们进行了简化。为了传达概念，以下部分内容故意略有不准确。

允许您加载和存储内存的指令将采用 32 位参数。因此您有一个“32 位地址”空间。这意味着您可以“与”4GB 大小的 RAM 或那里碰巧有的其他任何东西“对话”。

虚拟内存让我们可以将一个地址（逻辑或虚拟地址）映射到另一个地址（物理、实际地址）。默认状态是“身份映射”，其中每个逻辑地址都设置为其虚拟地址。映射发生在 4KB“页面”级别。

您有 2 个执行级别 - 用户模式和内核模式。内核模式需要进行身份映射，因为它管理系统和其他进程。

在用户模式下，内核映射内存，其中 RAM 从地址 0 开始，并且只能达到分配给它的内存量。内核控制所有进程的内存映射，并管理哪些内存是空闲的和正在使用的。内核可以从任何地方挑选空闲的 4K 字节页面并排列它们，使它们在用户模式进程看来是连续的。

如果用户模式页面访问的地址包含无效页面，则映射机制可能会导致“页面错误”。如果用户模式应用程序尝试访问比其拥有的更多的内存，它将访问“坏”页面并引发内核异常。然后内核会以“分段错误”错误将其杀死。内核 API 允许应用程序请求更多内存 - 然后内核会尽可能地将一些可用内存映射到该应用程序，并在完成后释放它。

因此，虽然您拥有 32 位地址空间，但您不能在用户进程下随意使用所有地址，除非那里映射了某些内容。

现在 - 如果进程处于休眠状态，内核可能会故意将某些页面标记为“坏的”，如果它确定这些页面已经有一段时间没有被访问过，并将它们写入磁盘。当进程唤醒时，它将尝试访问这些坏的页面并触发内核异常。内核不会“分段错误”，而是会从磁盘检索页面，将它们重新放入内存中（可能在不同的物理位置，但映射到进程的相同逻辑位置），然后恢复进程。这就是交换或页面文件如何融入其中。

现代 Windows 和 Linux 内核都提供了一种称为的功能，mmap这种机制被“故意”使用，允许像访问内存一样访问文件。用户空间进程可以选择一个地址来放置它 - 内核将通过动态加载或写入文件的正确部分来响应“故障”。它使用这种分页机制来实现这一点。在具有非常宽的地址空间的 64 位系统上，可以像访问内存中的文件一样访问非常大的文件，这简化了一些程序。

Answer