我想知道一种更好的“命名事物”的方法(关于linux中的内存管理),以避免我的文章的读者误解某些东西,但也避免每次都使用长短语。
- 我将文件备份称为一个页面,在回收的情况下,可以将其丢弃,因为可以再次从磁盘检索其内容。但是,当关注“file-backed =可以在页面回收的情况下丢弃”的意义上时,我不知道是否存在特殊情况,在页面回收的情况下可以丢弃页面,但仍然不能考虑文件支持。考虑特殊的零页:虽然它不能被回收,但它的内容是“恒定的”。如果虚拟页被映射到零页,您可以安全地“取消映射”它,因为您可以“再次映射它”而不会丢失信息。是否存在“在页面回收的情况下可以被丢弃”的断言与文件支持页面的想法不太匹配的情况?或者这两个概念之间实际上存在一个当且仅当?
- 区分整个可寻址范围中的虚拟内存和当前存在的虚拟页中的虚拟内存。
- 关于“映射”:如果我说映射一个页面,它意味着什么,创建一个新的虚拟页面并将其放在整个可寻址范围内的某个位置,或者“页面映射”意味着:“将虚拟页面与页面关联页面错误后在 RAM 中”?当页面被换出然后再次移动到 RAM 时,说“页面映射”来指代第二种情况是否正确,即先前映射到交换中的页面的虚拟页面现在指向新的页面内存页?
- 物理页:它是专门指 RAM 中的页,还是物理存在于某处(RAM 或磁盘)的页?
- 我想区分“映射”到位于某处的页面的虚拟页面与位于某处的页面本身。我喜欢用“未使用的页面”来表示没有人映射的虚拟页面,因此我在这里描述的情况与此相反。但如果我说“已使用的页面”,我不知道是否可以将其理解为“最近引用”或类似的内容。例如,映射到零页的虚拟页不是物理页,零页是物理页,但我不知道如何正确命名这两个概念。
- 我想区分一个页面旨在分享与实际共享的页面。例如,映射到
.text
二进制文件本身的部分的页面。该页面是旨在分享或者潜在共享(换句话说,并不意味着是私人的)。但是,它是否实际上共享取决于是否有多个进程执行相同的二进制文件。与“私有”相同:页面可以是私有的,也可以是共享的,但意味着是私有的。例如,CoW 虚拟页面(例如映射到零页面的虚拟页面或在 a 之后从父进程继承的虚拟页面)fork
:两者都是共享的,但意味着是私有的。我想知道如何用名称来区分这两种情况。 - 匿名与文件支持的页面:另一个造成混乱的原因。考虑以下情况:动态链接库在运行时虚拟映射到进程。尚未分配 RAM 页。该
.so
文件有一个 8kB 的.data
部分,其中包含一些全局变量。一些全局变量已被访问,然后两个页面都被分配 RAM。这些是真正的文件支持页面(在页面回收的情况下,它们可以被丢弃而不是移动到交换区)。现在,一些变量被修改,导致两个页面与文件分离,因此变得匿名(因此它们不能再被丢弃)。但是,如果我cat smaps
会看到引用该文件的相应地址范围(inode 不同于 0,并且显示文件的路径.so
);但是,现在两个页面都是匿名的(Anonymous
输出字段smaps
将等于8 kB
)。这里,“地址范围”指的是一个文件,但是现在它的页面都不是文件支持的。有没有办法区分“引用文件”的页面或范围,或者“来自文件”,或者它们在过去的某个时刻“文件支持”,其中页面是现在有文件支持吗?
答案1
文件支持表示该页面映射到文件的页面。文件支持的页面是通过调用
mmap()
文件描述符来创建的。这是在exec
加载进程时(文本段由可执行文件支持)以及动态链接器在链接共享库时自动完成的。为了指示回收页面时是否可以丢弃,术语是污垢和干净的。脏页自从磁盘上最后一页以来已经发生了变化,并且这些需要写回磁盘。干净的页面可以简单地丢弃。这与是否有文件支持无关;交换支持的页面也可以是脏的或干净的。文件支持的页面可能是脏的,这就是使用内存映射更新文件的方式。
虚拟内存可以通过多种方式使用。它的基本定义是自动内存管理系统,允许进程访问比物理 RAM 更多的数据。这是区别于交换,其中可以有多个进程,其内存总和大于 RAM,但单个进程仍受限于物理 RAM;如今这并不常见,但只要切换进程,就会在磁盘和 RAM 之间复制进程的整个地址空间。
虚拟内存也用于指进程的虚拟地址空间,而不是其实现的物理 RAM。用户模式进程一般只能访问虚拟内存,物理内存由操作系统和CPU的内存管理组件寻址。
和虚拟内存有时也用于指代虚拟内存子系统管理的所有内存。在磁盘空间不像现在那么便宜的日子里,“虚拟内存耗尽”的情况并不罕见——交换分区不够大,无法容纳所有非文件支持的内存。
映射指将虚拟内存页面与某个磁盘页面相关联。对于文件支持的页面,它被映射到文件的相应页面。匿名页面映射到交换页面。由于后者通常是透明的,因此我们主要使用该术语来指代文件支持的页面,通常是使用
mmap()
.物理页通常表示 RAM 的一页,以区别于虚拟页面。
“我想区分“映射”到位于某处的页面的虚拟页面与位于某处的页面本身。”我不确定是否有一个合适的术语来形容这一点。
“我想区分旨在共享的页面和实际共享的页面。”我认为这个词是可分享的。对于最初共享的页面
fork()
,我认为没有什么比私人的。如果它们最初是共享的,这意味着 COW。“匿名与文件支持的页面”。该
.data
部分可以用 来映射MAP_PRIVATE
。如上所述,这意味着 COW。所以它最初是文件支持的,但是当你弄脏它时,它将作为匿名页面映射到交换区。