我正在尝试探索 Linux 的页面错误行为。我制作了一个 lxc 容器,将内存限制为 1GB(通过将 'lxc.cgroup.memory.limit_in_bytes = 1G' 添加到 /etc/lxc/default.conf 中)。然后,我运行了一个简单的代码来访问 2GB 的数据量。
int main() {
char* buf = malloc(1024*1024*1024);
char* buf2 = malloc(1024*1024*1024);
if (buf == 0 || buf2 == 0) {
printf("Malloc failed!\n");
return 0;
}
int i,j,k;
for (i=0; i<1024; i++)
for (j=0; j<1024; j++)
for (k=0; k<1024; k++)
buf[i*1024*1024 + j*1024 + k] = i+j+k;
for (i=0; i<1024; i++)
for (j=0; j<1024; j++)
for (k=0; k<1024; k++)
buf2[i*1024*1024 + j*1024 + k] = i+j+k;
free(buf);
free(buf2);
while(1);
return 0;
}
该代码使用 -O0 进行编译并在容器内运行。当程序到达 while(1); 时,我检查它经历了多少次页面错误
ps -eo maj_flt,cmd | grep a.out
其中 a.out 是编译后的可执行文件。有时我会遇到 200~300 个页面错误;然而,有时我只看到 10~20 个页面错误。因为内存只有1G,所以我认为至少总是会发生1G/4K = 256K 页面错误。为什么有时我只看到 10~20 个页面错误?我确认我的 Linux 默认使用 4K 页面。
我是 Linux 新手。任何见解都会非常有帮助!谢谢。
答案1
我解决了这个问题。
- 我的代码的一个主要问题是,在第一次写入 malloc 页面时,不会发生页面错误,因为 Linux 不必从磁盘读取空页面。我更改了代码,使其运行代码的循环部分两次。
- 另外,我禁用了 Linux 预读(通过 echo "0" >> /proc/sys/vm/page-cluster)
通过这两个更改,我能够看到大约 2G / 4K = 524,288 个页面错误(确切地说是 524,304 个)。
答案2
为什么每个页面第一次写入内存时都会出现页面错误?对于虚拟内存子系统来说,这或多或少是最糟糕的结果。因此,任何优化、缓存、预加载、检测访问模式等都将减少这个数字。如果您尝试这样做,如果任何操作系统都能可靠地为您提供计算出的 256,000 个页面错误,我会感到惊讶。
答案3
您在启用优化和编译器的情况下编译了它删除了你的循环,铿锵将将你的整个程序转变为:
int main() {
while(1);
}