即使 RAM 和 SWAP 有足够的空闲空间,Oracle 也会调用 oom-killer 吗?

即使 RAM 和 SWAP 有足够的空闲空间,Oracle 也会调用 oom-killer 吗?

你能告诉我这个 Oracle 进程被杀死的原因吗?似乎有很多 RAM 可用,也有很多 SWAP 可用。随后其他几个 Oracle 进程也被杀死。虚拟机有 16G 的 vMem 和 8 个 vCPU。但我在这里发布第一个被杀死的 Oracle 进程:

3 月 1 日 20:00:58 ******* 内核:oracle 调用 oom-killer:gfp_mask=0x280da、order=0、oom_adj=0、oom_score_adj=0
3 月 1 日 20:00:58 ******* 内核:oracle cpuset=/mems_allowed=0
3 月 1 日 20:00:58 ******* 内核:Pid:2370,通信:oracle 未受污染 2.6.32-431.el6.x86_64 #1
3 月 1 日 20:00:58 ******* 内核:调用跟踪:
3 月 1 日 20:00:58 ******* 内核:[] ?cpuset_print_task_mems_allowed+0x91/0xb0
3 月 1 日 20:00:58 ******* 内核:[] ? dump_header+0x90/0x1b0
3 月 1 日 20:00:58 ******* 内核:[] ? security_real_capable_noaudit+0x3c/0x70
3 月 1 日 20:00:58 ******* 内核:[] ? oom_kill_process+0x82/0x2a0
3 月 1 日 20:00:58 ******* 内核:[] ? select_bad_process+0xe1/0x120
3 月 1 日 20:00:58 ******* 内核:[] ? out_of_memory+0x220/0x3c0
3 月 1 日 20:00:58 ******* 内核:[] ? __alloc_pages_nodemask+0x8ac/0x8d0
3 月 1 日 20:00:58 ******* 内核:[] ? alloc_pages_vma+0x9a/0x150
3 月 1 日 20:00:58 ******* 内核:[] ? handle_pte_fault+0x73d/0xb00
3 月 1 日 20:00:58 ******* 内核:[] ? free_pgtables+0xce/0x120
3月1日 20:00:58 ******* 内核:[] ? unmap_region+0xcd/0x130
3 月 1 日 20:00:58 ******* 内核:[] ? vma_prio_tree_add+0x75/0xd0
3 月 1 日 20:00:58 ******* 内核:[] ? handle_mm_fault+0x22a/0x300
3 月 1 日 20:00:58 ******* 内核:[] ? __do_page_fault+0x138/0x480
3月1日 20:00:58 ******* 内核:[] ? do_mmap_pgoff+0x335/0x380
3 月 1 日 20:00:58 ******* 内核:[] ? do_page_fault+0x3e/0xa0
3 月 1 日 20:00:58 ******* 内核:[] ? page_fault+0x25/0x30
3 月 1 日 20:00:58 ******* 内核:Mem-Info:
3 月 1 日 20:00:58 ******* 内核:节点 0 每个 CPU 的 DMA:
3 月 1 日 20:00:58 ******* 内核:CPU 0:hi:0,btch:1 美元:0
3 月 1 日 20:00:58 ******* 内核:CPU 1:hi:0,btch:1 美元:0
3 月 1 日 20:00:58 ******* 内核:CPU 2:hi:0,btch:1 美元:0
3 月 1 日 20:00:58 ******* 内核:CPU 3:hi:0,btch:1 美元:0
3 月 1 日 20:00:58 ******* 内核:CPU 4:hi:0,btch:1 美元:0
3 月 1 日 20:00:58 ******* 内核:CPU 5:hi:0,btch:1 美元:0
3 月 1 日 20:00:58 ******* 内核:CPU 6:hi:0,btch:1 美元:0
3 月 1 日 20:00:58 ******* 内核:CPU 7:hi:0,btch:1 美元:0
3 月 1 日 20:00:58 ******* 内核:节点 0 DMA32 每个 CPU:
3 月 1 日 20:00:58 ******* 内核:CPU 0:hi:186,btch:31 美元:0
3 月 1 日 20:00:58 ******* 内核:CPU 1:hi:186,btch:31 美元:0
3 月 1 日 20:00:58 ******* 内核:CPU 2:hi:186,btch:31 美元:0
3 月 1 日 20:00:58 ******* 内核:CPU 3:hi:186,btch:31 美元:0
3 月 1 日 20:00:58 ******* 内核:CPU 4:hi:186,btch:31 美元:0
3 月 1 日 20:00:58 ******* 内核:CPU 5:hi:186,btch:31 美元:0
3 月 1 日 20:00:58 ******* 内核:CPU 6:hi:186,btch:31 美元:0
3 月 1 日 20:00:58 ******* 内核:CPU 7:hi:186,btch:31 美元:0
3 月 1 日 20:00:58 ******* 内核:节点 0 每个 CPU 正常:
3 月 1 日 20:00:58 ******* 内核:CPU 0:hi:186,btch:31 美元:0
3 月 1 日 20:00:58 ******* 内核:CPU 1:hi:186,btch:31 美元:0
3 月 1 日 20:00:58 ******* 内核:CPU 2:hi:186,btch:31 美元:0
3 月 1 日 20:00:58 ******* 内核:CPU 3:hi:186,btch:31 美元:20
3 月 1 日 20:00:58 ******* 内核:CPU 4:hi:186,btch:31 美元:32
3 月 1 日 20:00:58 ******* 内核:CPU 5:hi:186,btch:31 美元:0
3 月 1 日 20:00:58 ******* 内核:CPU 6:hi:186,btch:31 美元:184
3 月 1 日 20:00:58 ******* 内核:CPU 7:hi:186,btch:31 美元:0
3 月 1 日 20:00:58 ******* 内核:active_anon:2673615 inactive_anon:368657isolated_anon:0
3 月 1 日 20:00:58 ******* 内核:active_file:3541 inactive_file:3962 independent_file:32
3 月 1 日 20:00:58 ******* 内核:不可驱逐:0 脏:3 写回:2770 不稳定:0
3 月 1 日 20:00:58 ******* 内核:free:33763 slab_reclaimable:16555 slab_unreclaimable:28221
3 月 1 日 20:00:58 ******* 内核:映射:1517627 shmem:1730877 页表:906135 跳出:0
3 月 1 日 20:00:58 ******** 内核:节点 0 DMA 空闲:15132kB 最小:60kB 最低:72kB 最高:88kB active_anon:0kB inactive_anon:0kB active_file:0kB inactive_file:0kB unevictable:0kB 隔离(匿名):0kB 隔离(文件):0kB 存在:14740kB mlocked:0kB dirty:0kB writeback:0kB 映射:0kB shmem:0kB slab_reclaimable:0kB slab_unreclaimable:0kB kernel_stack:0kB pagetables:0kB 不稳定:0kB bounce:0kB writeback_tmp:0kB pages_scanned:0 all_unreclaimable?是
3月1日 20:00:58 ******* 内核:lowmem_reserve[]:0 3000 16130 16130
3 月 1 日 20:00:58 ******** 内核:节点 0 DMA32 可用:64904kB 最小:12556kB 低:15692kB 高:18832kB active_anon:2064816kB inactive_anon:516452kB active_file:492kB inactive_file:188kB 不可驱逐:0kB 隔离(匿名):0kB 隔离(文件):0kB 存在:3072096kB mlocked:0kB 脏:0kB 回写:0kB 映射:2319432kB shmem:2352892kB slab_reclaimable:7420kB slab_unreclaimable:3620kB kernel_stack:832kB 页表:24672kB 不稳定:0kB 反弹:0kB writeback_tmp:0kB pages_scanned:1 all_unreclaimable?否
3 月 1 日 20:00:58 ******* 内核:lowmem_reserve[]:0 0 13130 13130
3 月 1 日 20:00:58 ******** 内核:节点 0 正常 空闲:55016kB 最小:54964kB 低:68704kB 高:82444kB active_anon:8629644kB inactive_anon:958176kB active_file:13672kB inactive_file:15660kB 不可驱逐:0kB 隔离(匿名):0kB 隔离(文件):128kB 存在:13445120kB mlocked:0kB 脏:12kB 写回:11080kB 映射:3751076kB shmem:4570616kB slab_reclaimable:58800kB slab_unreclaimable:109264kB kernel_stack:5360kB 页表:3599868kB不稳定:0kB 反弹:0kB writeback_tmp:0kB pages_scanned:160 all_unreclaimable?没有
3 月 1 日 20:00:58 ******* 内核:lowmem_reserve[]:0 0 0 0
3 月 1 日 20:00:58 ******* 内核:节点 0 DMA:3*4kB 2*8kB 2*16kB 3*32kB 2*64kB 2*128kB 1*256kB 0*512kB 0*1024kB 1*2048kB 3*4096kB = 15132kB
3 月 1 日 20:00:58 ******* 内核:节点 0 DMA32:1225*4kB 859*8kB 878*16kB 547*32kB 184*64kB 34*128kB 0*256kB 0*512kB 0*1024kB 1*2048kB 1*4096kB = 65596kB
3月1日 20:00:58 ******* 内核:节点 0 正常:9165*4kB 1804*8kB 46*16kB 2*32kB 1*64kB 1*128kB 1*256kB 1*512kB 1*1024kB 1*2048kB 0*4096kB = 55924kB
3 月 1 日 20:00:58 ******* 内核:共计 1760824 个页面缓存页面
3 月 1 日 20:00:58 ******* 内核:交换缓存中有 22460 个页面
3 月 1 日 20:00:58 ******* 内核:交换缓存统计信息:添加 6636857,删除 6614397,查找 15635455/16141480
3 月 1 日 20:00:58 ******* 内核:可用交换 = 33548340kB
3 月 1 日 20:00:58 ******* 内核:总交换空间 = 36184056kB
3 月 1 日 20:00:58 ******* 内核:4194288 页 RAM
3 月 1 日 20:00:58 ******* 内核:保留 111808 页
3 月 1 日 20:00:58 ******* 内核:共享 59252583 个页面
3 月 1 日 20:00:58 ******* 内核:2502605 个页面未共享
3 月 1 日 20:00:58 ******* 内核:[ pid ] uid tgid total_vm rss cpu oom_adj oom_score_adj 名称
3月1日 20:00:58 ******* 内核:[612] 0 612 2769 42 2 -17 -1000 udevd
3 月 1 日 20:00:58 ******* 内核:[1872] 0 1872 47365 204 7 0 0 vmtoolsd
3月1日 20:00:58 ******* 内核:[1980] 0 1980 23294 109 6 -17 -1000 auditd
3月1日 20:00:58 ******* 内核:[1996] 0 1996 62898 842 4 0 0 rsyslogd
3 月 1 日 20:00:58 ******* 内核:[2025] 0 2025 2738 93 3 0 0 irqbalance
3 月 1 日 20:00:58 ******* 内核:[2039] 32 2039 4744 68 4 0 0 rpcbind
3 月 1 日 20:00:58 ******* 内核:[2071] 29 2071 5837 61 3 0 0 rpc.statd
3 月 1 日 20:00:58 ******* 内核:[2092] 0 2092 5773 31 1 0 0 rpc.idmapd
3 月 1 日 20:00:58 ******* 内核:[2211] 0 2211 39323 127 5 0 0 pbx_exchange
3 月 1 日 20:00:58 ******* 内核:[2223] 0 2223 48106 158 5 0 0 winbindd
3月1日 20:00:58 ******* 内核:[2237] 0 2237 1020 48 4 0 0 acpid
3 月 1 日 20:00:58 ******* 内核:[2323] 0 2323 49766 281 0 0 0 winbindd
3 月 1 日 20:00:58 ******* 内核:[2540] 0 2540 26827 11 5 0 0 rpc.rquotad
3 月 1 日 20:00:58 ******* 内核:[2544] 0 2544 5414 41 5 0 0 rpc.mountd
3 月 1 日 20:00:58 ******* 内核:[2580] 0 2580 1570 23 0 0 0 mcelog
3月1日 20:00:58 ******* 内核:[2592] 0 2592 16651 78 5 -17 -1000 sshd
3 月 1 日 20:00:58 ******* 内核:[2600] 0 2600 5545 105 3 0 0 xinetd
3 月 1 日 20:00:58 ******* 内核:[2608] 38 2608 7147 132 5 0 0 ntpd
3月1日 20:00:58 ******* 内核:[2618] 498 2618 25741 57 2 0 0 uuidd
3 月 1 日 20:00:58 ******* 内核:[2630] 0 2630 43170 139 3 0 0 vnetd
3 月 1 日 20:00:58 ******* 内核:[2638] 0 2638 52398 158 2 0 0 bpcd
3 月 1 日 20:00:58 ******* 内核:[2655] 0 2655 198335 478 4 0 0 nbdisco
3 月 1 日 20:00:58 ******* 内核:[2676] 0 2676 76958 82 2 0 0 mtstrmd
3 月 1 日 20:00:58 ******* 内核:[2707] 0 2707 22314 141 0 0 0 sendmail
3月1日 20:00:58 ******* 内核:[2716] 51 2716 19658 80 4 0 0 sendmail
3 月 1 日 20:00:58 ******* 内核:[2734] 0 2734 200856 353 7 0 0 avagent.bin
3 月 1 日 20:00:58 ******* 内核:[2747] 0 2747 44287 178 3 0 0 已调整
3 月 1 日 20:00:58 ******* 内核:[2757] 0 2757 29333 103 6 0 0 crond
3 月 1 日 20:00:58 ******* 内核:[2778] 0 2778 27431 167 7 0 0 saphostexec
3月1日 20:00:58 ******* 内核:[2805] 600 2805 545016 4031 5 0 0 sapstartsrv
3 月 1 日 20:00:58 ******* 内核:[2885] 834 2885 100602 294 3 0 0 sapstartsrv
3 月 1 日 20:00:58 ******* 内核:[2904] 0 2904 5385 31 6 0 0 atd
3 月 1 日 20:00:58 ******* 内核:[2928] 0 2928 26005 69 5 0 0 rhsmcertd
3 月 1 日 20:00:58 ******* 内核:[2935] 0 2935 8154 1110 0 0 0 saposcol
3月1日 20:00:58 ******* 内核:[3098] 834 3098 13538 50 3 0 0 sapstart
3 月 1 日 20:00:58 ******* 内核:[3128] 834 3128 43278 119 5 0 0 jc.sapDAA_SMDA9
3 月 1 日 20:00:58 ******* 内核:[3144] 834 3144 1276839 57796 4 0 0 jstart
3 月 1 日 20:00:58 ******* 内核:[3211] 703 3211 33752 378 5 0 0 perl
3 月 1 日 20:00:58 ******* 内核:[3288] 703 3288 1181563 62355 0 0 0 java
3 月 1 日 20:00:58 ******* 内核:[3497] 0 3497 1016 34 1 0 0 mingetty
3月1日 20:00:58 ******* 内核:[3499] 0 3499 1016 34 1 0 0 mingetty
3 月 1 日 20:00:58 ******* 内核:[3502] 0 3502 1016 34 1 0 0 mingetty
3 月 1 日 20:00:58 ******* 内核:[3504] 0 3504 1016 34 2 0 0 mingetty
3 月 1 日 20:00:58 ******* 内核:[3506] 0 3506 1016 34 1 0 0 mingetty
3 月 1 日 20:00:58 ******* 内核:[3508] 0 3508 1016 34 1 0 0 mingetty
3 月 1 日 20:00:58 ******* 内核:[3515] 0 3515 3098 41 2 -17 -1000 udevd
3 月 1 日 20:00:58 ******* 内核:[3516] 0 3516 3098 41 4 -17 -1000 udevd
3 月 1 日 20:00:58 ******* 内核:[13764] 0 13764 48089 89 7 0 0 winbindd
3 月 1 日 20:00:58 ******* 内核:[13765] 0 13765 48089 92 7 0 0 winbindd
3月1日 20:00:58 ******* 内核:[13873] 703 13873 2403434 6196 5 0 0 oracle
3 月 1 日 20:00:58 ******* 内核:[13875] 703 13875 2402873 651 3 0 0 oracle
3月1日 20:00:58 ******* 内核:[13880] 703 13880 2402873 423 4 0 0 oracle
3 月 1 日 20:00:58 ******* 内核:[13875] 703 13875 2402873 651 3 0 0 oracle
3月1日 20:00:58 ******* 内核:[13880] 703 13880 2402873 423 4 0 0 oracle

..注意:删除了这里大量的 Oracle 进程,以限制此处发布的字符长度。总共有 296 个 Oracle 进程正在运行。
..
3 月 1 日 20:00:59 ******* 内核:[18644] 0 18644 44207 371 1 0 0 bpclntcmd
3 月 1 日 20:00:59 ******* 内核:[18647] 703 18647 57442 240 3 0 0 oracle
3月1日 20:00:59 ******* 内核:[18656] 703 18656 57442 185 6 0 0 oracle
3月1日 20:00:59 ******* 内核:[18657] 54329 18657 9279 196 1 0 0 nrpe
3月1日 20:00:59 ******* 内核:[18660] 54329 18660 9314 255 2 0 0 nrpe
3 月 1 日 20:00:59 ******* 内核:[18662] 0 18662 39263 289 5 0 0 crond
3 月 1 日 20:00:59 ******* 内核:[18663] 0 18663 5745 341 1 0 0 saposcol
3月1日 20:00:59 ******* 内核:[18664] 54329 18664 9315 146 3 0 0 nrpe
3月1日 20:00:59 ******* 内核:[18665] 54329 18665 5730 76 0 0 0 check_open_file
3月1日 20:00:59 ******* 内核:[18666] 54329 18666 6611 191 4 0 0 xinetd
3月1日 20:00:59 ******* 内核:[18667] 0 18667 8389 183 1 0 0 sapcimb
3月1日 20:00:59 ******* 内核:[18669] 0 18669 6610 171 0 0 0 xinetd
3月1日 20:00:59 ******* 内核:[18670] 0 18670 6610 171 0 0 0 xinetd
3月1日 20:00:59 ******* 内核:[18677] 0 18677 6610 177 5 0 0 xinetd
3月1日 20:00:59 ******* 内核:[18678] 703 18678 29497 275 4 0 0 perl
3月1日 20:00:59 ******* 内核:[18682] 703 18682 29497 252 7 0 0 perl
3月1日 20:00:59 ******* 内核:[18683] 703 18683 29497 231 0 0 0 perl
3 月 1 日 20:00:59 ******* 内核:[18687] 0 18687 2620 92 1 0 0 .SAPOSCOL_00000
3月1日 20:00:59 ******* 内核:[18688] 0 18688 6610 186 5 0 0 xinetd
3月1日 20:00:59 ******* 内核:[18689] 0 18689 6610 189 2 0 0 xinetd
3月1日 20:00:59 ******* 内核:[18690] 0 18690 6610 191 3 0 0 xinetd
3月1日 20:00:59 ******* 内核:[18691] 0 18691 6610 194 2 0 0 xinetd
3 月 1 日 20:00:59 ******* 内核:内存不足:终止进程 13900 (oracle) 得分 77 或牺牲子进程
3 月 1 日 20:00:59 ******* 内核:已终止进程 13900,UID 703,(oracle) total-vm:9622308kB,anon-rss:5180kB,file-rss:4028040kB
 

从上面来看,我认为这些行表明我有足够的 RAM 和交换空间,对吗?:

节点 0 DMA 可用:15132kB
节点 0 DMA32 可用:64904kB
节点 0 正常空闲:55016kB
可用交换 = 33548340kB
总交换量 = 36184056kB

想知道节点 0 DMA 的“all_unreclaimable?yes”和节点 0 DMA31 和节点 0 正常的“all_unreclaimable?no”是什么意思!

此外,以下信息可能会提供有关服务器设置的更多信息:

$sudo sysctl -p
net.ipv4.ip_forward = 0
net.ipv4.conf.default.rp_filter = 1
net.ipv4.conf.default.accept_source_route = 0
内核.sysrq = 0
kernel.core_uses_pid = 1
net.ipv4.tcp_syncookies = 1
错误:“net.bridge.bridge-nf-call-ip6tables”是一个未知的密钥
错误:“net.bridge.bridge-nf-call-iptables”是一个未知的密钥
错误:“net.bridge.bridge-nf-call-arptables”是一个未知的密钥
内核.msgmnb = 65536
内核.msgmax = 65536
内核.shmmax = 68719476736
内核.msgmni = 1024
内核.sem = 1250 256000 100 8192
vm.max_map_count = 1000000
内核.shmall = 1152921504606846720
fs.文件最大值 = 19801952
net.core.rmem_default = 1048576
net.core.wmem_default = 262144
net.core.rmem_max = 4194304
net.core.wmem_max = 1048576
fs.aio 最大数量 = 1048576
net.ipv4.ip_local_port_range = 9000 65500
vm.swappiness = 0
vm.dirty_background_ratio = 3
vm.dirty_ratio = 15
vm.dirty_expire_centisecs = 500
vm.dirty_writeback_centisecs = 100
内核.shmmni = 4096

答案1

您根本没有多少可用内存。

首先,vm.swappiness = 0 只有当您确信有足够的内存时才这样做。将其设置为 10 左右可能会避免内存不足的情况。并且实际上会利用您的分页空间。

从节点 0 的摘要来看,您的 16 GB 大约是四分之一的页表、四分之一的共享内存、一半的匿名程序内存以及一些其他零碎的东西。请注意,可用的文件内存加上空闲内存只有几十 MB,并不大。它无法再为您提供大约 1 GB 的共享内存。

页表正在吞噬你。你可能没有启用大页面,Oracle 建议用于数据库,Red Hat 也是如此。

相关内容