“页面分配失败”内核消息的解释

“页面分配失败”内核消息的解释

我的 RHEL7 系统上出现“页面分配失败”错误。这里是:

内核:[85531.010995] sh:页面分配失败:顺序:4,模式:0x2040d0
内核:[85531.011000] CPU:1 PID:20846 通讯:sh 未污染 3.10.0-693.el7.AV1.x86_64 #1
内核:[85531.011002] 硬件名称:VMware, Inc. VMware 虚拟平台/440BX 桌面参考平台,BIOS 6.00 09/21/2015
内核:[85531.011003] 00000000002040d0 00000000d00413f4 ffff8800070ffa18 ffffffff816a3e1d
内核:[85531.011006] ffff8800070ffaa8 ffffffff81188d00 0000000000000000 ffff88023ffd8000
内核:[85531.011008] 0000000000000004 00000000002040d0 ffff8800070ffaa8 00000000d00413f4
内核:[85531.011010]调用跟踪:
内核:[85531.011018] [] dump_stack+0x19/0x1b
内核:[85531.011023] [] warn_alloc_failed+0x110/0x180
内核:[85531.011026] [] __alloc_pages_slowpath+0x6b6/0x724
内核:[85531.011028] [] __alloc_pages_nodemask+0x405/0x420
内核:[85531.011031] [] alloc_pages_current+0x98/0x110
内核:[85531.011035] [] new_slab+0x2fc/0x310
内核:[85531.011037] [] ___slab_alloc+0x3ac/0x4f0
内核:[85531.011042] []?复制进程+0x18e/0x19a0
内核:[85531.011044] []?复制进程+0x18e/0x19a0
内核:[85531.011046] [] __slab_alloc+0x40/0x5c
内核:[85531.011049] [] kmem_cache_alloc_node+0x8b/0x200
内核:[85531.011051] [] copy_process+0x18e/0x19a0
内核:[85531.011053] [] do_fork+0x91/0x320
内核: [85531.011056] [] SyS_clone+0x16/0x20
内核:[85531.011059] []stub_clone+0x69/0x90
内核:[85531.011061] []?系统调用快速路径+0x16/0x1b
内核:[85531.011062]内存信息:
内核:[85531.011066] active_anon:1145227 inactive_anon:278512isolated_anon:0
内核:[85531.011066] 活动文件:181319 不活动文件:185784 隔离文件:0
内核:[85531.011066]不可删除:2695脏:4333写回:0不稳定:0
内核:[85531.011066]slab_reclaimable:45889slab_unreclaimable:54798
内核:[85531.011066] 映射:79471 shmem:52418 页表:11994 反弹:0
内核:[85531.011066]免费:33850 free_pcp:0 free_cma:0
内核:[85531.011069] 节点 0 DMA 空闲:15868kB 最小:132kB 低:164kB 高:196kB active_anon:0kB inactive_anon:0kB active_file:0kB inactive_file:0kB unevictable:0kB 隔离(匿名):0kB 隔离(文件):0kB 存在:15992kB 管理:15908kB mlocked:0kB dirty:0kB writeback:0kB 映射:0kB shmem:0kB slab_reclaimable:0kB slab_unreclaimable:8kB kernel_stack:0kB pagetables:0kB 不稳定:0kB bounce:0kB free_pcp:0kB local_pcp:0kB free_cma:0kB writeback_tmp:0kB pages_scanned:0 all_unreclaimable?是的
内核:[85531.011073] lowmem_reserve[]:0 2809 7800 7800
内核:[85531.011076]节点0 DMA32空闲:53892kB最小值:24292kB低:30364kB高:36436kB active_anon:1622080kB inactive_anon:516652kB active_file:203244kB inactive_file:212104kB不可破坏:2312kB隔离(匿名):0kB 隔离(文件):0kB 当前:3129280kB托管:2878656kB mlocked:2312kB脏:6236kB写回:0kB映射:115972kB shmem:79808kBslab_reclaimable:77740kBslab_unreclaimable:90500kB内核堆栈:13680kB页表:17624kB不稳定:0kB反弹:0kB free_pcp:0kB local_pcp:0kB free_cma:0kB writeback_tmp:0kB Pages_scanned: 0 all_unreclaimable?不
内核:[85531.011080] lowmem_reserve[]:0 0 4990 4990
内核:[85531.011082]节点0正常空闲:65640kB最小值:43152kB低:53940kB高:64728kB active_anon:2958828kB inactive_anon:597396kB active_file:522032kB inactive_file:531032kB不可删除:8468kB隔离(an上):0kB 隔离(文件):0kB 当前:5242880kB托管:5110372kB mlocked:8464kB 脏:11096kB 写回:0kB 映射:201912kB shmem:129864kB 平板可回收:105816kB 平板不可回收:128684kB 内核堆栈:19936kB 页表:30352kB 不稳定:0kB 反弹:0kB free_pcp :0kB local_pcp:0kB free_cma:0kB writeback_tmp:0kB Pages_scanned: 0 all_unreclaimable?不
内核:[85531.011085] lowmem_reserve[]:0 0 0 0
内核:[85531.011087] 节点 0 DMA:1*4kB (U) 1*8kB (U) 1*16kB (U) 1*32kB (U) 1*64kB (U) 1*128kB (U) 1*256kB (U) ) 0*512kB 1*1024kB (U) 1*2048kB (M) 3*4096kB (M) = 15868kB
内核:[85531.011095]节点0 DMA32:2946*4kB(UEM)1995*8kB(UEM)1241*16kB(UEM)186*32kB(UEM)9*64kB(U)0*128kB 0*256kB 0*512kB 0* 1024kB 0*2048kB 0*4096kB = 54128kB
内核:[85531.011102]节点0正常:16005*4kB(UEM)248*8kB(UEM)0*16kB 0*32kB 0*64kB 0*128kB 0*256kB 0*512kB 0*1024kB 0*2048kB 0*4096kB = 66 004kB
内核:[85531.011108] 节点 0hugepages_total=0hugepages_free=0hugepages_surp=0hugepages_size=2048kB
内核:[85531.011109] 428930 页面缓存页面总数
内核:[85531.011110] 交换缓存中有 8261 页
内核:[85531.011111]交换缓存统计:添加 51264,删除 43003,查找 2892763/2894481
内核:[85531.011112]免费交换= 5078128kB
内核:[85531.011113] 总交换 = 5242876kB
内核:[85531.011114] 2097038 页 RAM
内核:[85531.011114] 0 页 HighMem/MovableOnly
内核:[85531.011115] 保留 95804 页
内核:[85531.011116] SLUB:无法在节点 -1 上分配内存(gfp=0xd0)
内核:[85531.011118]缓存:task_struct,对象大小:45024,缓冲区大小:45024,默认顺序:4,最小顺序:4
内核:[85531.011119]节点0:板:2114,对象:2114,空闲:0

问题是关于其消息的最新部分:

内核:[85531.011116] SLUB:无法在节点 -1 上分配内存(gfp=0xd0)
内核:[85531.011118]缓存:task_struct,对象大小:45024,缓冲区大小:45024,默认顺序:4,最小顺序:4
内核:[85531.011119]节点0:板:2114,对象:2114,空闲:0

-1当Zone from分配失败时,为什么节点索引有Node 0?这有点令人困惑..

内核:[85531.011087] 节点 0 DMA:1*4kB (U) 1*8kB (U) 1*16kB (U) 1*32kB (U) 1*64kB (U) 1*128kB (U) 1*256kB (U) ) 0*512kB 1*1024kB (U) 1*2048kB (M) 3*4096kB (M) = 15868kB
内核:[85531.011095]节点0 DMA32:2946*4kB(UEM)1995*8kB(UEM)1241*16kB(UEM)186*32kB(UEM)9*64kB(U)0*128kB 0*256kB 0*512kB 0* 1024kB 0*2048kB 0*4096kB = 54128kB
内核:[85531.011102]节点0正常:16005*4kB(UEM)248*8kB(UEM)0*16kB 0*32kB 0*64kB 0*128kB 0*256kB 0*512kB 0*1024kB 0*2048kB 0*4096kB = 66 004kB

答案1

节点-1表示“任何节点”。您可能只有一个节点。 Red Hat 的内核经过配置,可以通过模拟只有一个节点的 NUMA 计算机来在单节点计算机上运行。检查启动日志 (/var/log/dmesg)。我有:

[    0.000000] No NUMA configuration found
[    0.000000] Faking a node at [mem 0x0000000000000000-0x000000023bffffff]

相关内容