其中一个电源发生故障后,系统日志中记录了以下错误。(操作系统是 ubuntu 14.04。)我在具有 128 RAM 的服务器上运行具有 64 HEAP 的 JVM(java 虚拟机)。您认为电源故障会影响 RAM 分配吗?或者对操作系统或正在运行的应用程序有影响吗?
7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.166347] 除法错误:0000 [#1] SMP 7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.166489] 链接的模块:nfsv3 rpcsec_gss_krb5 nfsv4 nfsd auth_rpcgss nfs_acl nfs lockd grace sunrpc fscache btrfs xor raid6_pq ufs qnx4 hfsplus hfs minix ntfs msdos jfs xfs libcrc32c intel_rapl x86_pkg_temp_thermal intel_powerclamp ipmi_ssif coretemp kvm_intel kvm ipmi_devintf irqbypass crct10dif_pclmul crc32_pclmul aesni_intel aes_x86_64 lrw gf128mul glue_helper input_leds mxm_wmi ablk_helper dcdbas joydev cryptd sb_edac 8250_fintek ipmi_si edac_core mei_me shpchp ipmi_msghandler mei acpi_power_meter wmi mac_hid lpc_ich nls_iso8859_1 lp parport hid_generic usbhid uas hid usb_storage tg3 ptp ahci libahci pps_core megaraid_sas fjes 7月25日 14:14:37 ubuntu-132 内核:[14872493.168579] CPU: 30 PID:158701 通信:java 未受污染 4.4.0-31-generic #50~14.04.1-Ubuntu 7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.168846] 硬件名称:Dell Inc. PowerEdge R430/0CN7X8,BIOS 2.4.2 01/09/2017 7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.169097] 任务:ffff88025e24d280 ti:ffff88011bb40000 task.ti:ffff88011bb40000 7 月 25 日 14:14:37 ubuntu-132 内核: [14872493.169347] RIP:0010:[] [] task_numa_find_cpu + 0x238 / 0x700 7月25日14:14:37 ubuntu-132内核:[14872493.169635] RSP:0000:ffff88011bb43bb0 EFLAGS:00010257 7月25日14:14:37 ubuntu-132内核:[14872493.169806] RAX:0000000000000000 RBX:ffff88011bb43c50 RCX:00000000000000000 7月25日14:14:37 ubuntu-132内核: [14872493.170036] RDX:0000000000000000 RSI:0000000000000001 RDI:ffff88018579c400 7月25日14:14:37 ubuntu-132内核:[14872493.170267] RBP:ffff88011bb43c18 R08:00000001dd9a90d7 R09:000000000007f981 7月25日14:14:37 ubuntu-132内核:[14872493.170503] R10:000000000006a5cb R11:ffffffffffffd86 R12:ffff8802534444c0 7月25日 14:14:37 ubuntu-132 内核:[14872493.170741] R13:0000000000000013 R14:00000000000002c8 R15:ffffffffffffffdad 7月25日 14:14:37 ubuntu-132 内核:[14872493.170980] FS:00007fc16b7f7700(0000) GS:ffff88103e9c0000(0000) knlGS:00000000000000000 7月25日 14:14:37 ubuntu-132 内核: [14872493.171249] CS:0010 DS:0000 ES:0000 CR0:0000000080050033 7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.171443] CR2:00007fc16b7f5ef8 CR3:00000001c6f71000 CR4:00000000003406e0 7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.171680] DR0:0000000000000000 DR1:0000000000000000 DR2: 0000000000000000 7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.171919] DR3:0000000000000000 DR6:00000000fffe0ff0 DR7:0000000000000400 7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.172157] 堆栈:7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.172229] 0000000000002e04 0000000000002f9 000000000000030f ffff88025e24d280 7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.172492] 00000000000002c9 0000000000000021 0000000000016d00 00000000000002c9 7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.172755] ffff88025e24d280 000000000000008f ffff88011bb43c50 00000000000001e3 7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.173017] 调用跟踪:7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.173105] [] task_numa_migrate+0x4a0/0x930 7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.173300] []? update_curr+0x80/0x170 7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.182774] [] numa_migrate_preferred+0x79/0x80 7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.192289] [] task_numa_fault+0x91d/0xcc0 7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.201866] []? mpol_misplaced+0x14e/0x190 7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.211507] [] handle_pte_fault+0x5a6/0x1470 7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.221002] [] ? schedule_hrtimeout_range_clock+0xb9/0x130 7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.230440] [] ? schedule_hrtimeout_range_clock+0xa0/0x130 7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.239693] [] handle_mm_fault+0x250/0x540 7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.248859] [] __do_page_fault+0x19a/0x430 7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.257910] [] do_page_fault+0x22/0x30 7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.266879] [] page_fault+0x28/0x30 7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.275686] 代码:4d b0 4c 89 f7 e8 29 d5 ff ff 48 8b 4d b0 49 8b 86 b0 00 00 00 31 d2 48 0f af 81 d8 01 00 00 49 8b 4e 78 4c 8b 73 78 48 83 c1 01 <48> f7 f1 48 8b 4b 20 49 89 c1 48 29 c1 4c 03 4b 48 4c 39 7d d0 7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.294167] RIP [] task_numa_find_cpu+0x238/0x700 7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.303258] RSP 7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.329766] ---[结束跟踪 b138563aaca724d4]4d b0 4c 89 f7 e8 29 d5 ff ff 48 8b 4d b0 49 8b 86 b0 00 00 00 31 d2 48 0f af 81 d8 01 00 00 49 8b 4e 78 4c 8b 73 78 48 83 c1 01 <48> f7 f1 48 8b 4b 20 49 89 c1 48 29 c1 4c 03 4b 48 4c 39 7d d0 7月25日14:14:37 ubuntu-132内核:[14872493.294167] RIP [] task_numa_find_cpu+0x238/0x700 7月25日14:14:37 ubuntu-132 内核:[14872493.303258] RSP 7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.329766] ---[结束跟踪 b138563aaca724d4]4d b0 4c 89 f7 e8 29 d5 ff ff 48 8b 4d b0 49 8b 86 b0 00 00 00 31 d2 48 0f af 81 d8 01 00 00 49 8b 4e 78 4c 8b 73 78 48 83 c1 01 <48> f7 f1 48 8b 4b 20 49 89 c1 48 29 c1 4c 03 4b 48 4c 39 7d d0 7月25日14:14:37 ubuntu-132内核:[14872493.294167] RIP [] task_numa_find_cpu+0x238/0x700 7月25日14:14:37 ubuntu-132 内核:[14872493.303258] RSP 7 月 25 日 14:14:37 ubuntu-132 内核:[14872493.329766] ---[结束跟踪 b138563aaca724d4]
答案1
冗余电源就是冗余的……在任何情况下,两个电源中的一个都应该能够断开或发生故障,而不会影响服务器的运行。在大多数情况下,内核甚至不知道电源发生故障,或者即使知道也只是记录下来或通知系统管理员出现问题。
但是,当电源发生故障时,可能会瞬间导致短路或过压/欠压,这可能会导致服务器中的几乎所有设备无法正常工作。大多数主板在冗余电源电路中内置了针对此类情况的保护措施,但这些措施并不完善。
为了回答您的具体问题,尝试澄清您的问题:
您认为冗余电源服务器中的一个电源故障会影响 RAM 分配吗?
不,电源故障本身可能不会导致 RAM 分配失败。更可能的原因如上所述。
上述电源故障会对操作系统或正在运行的应用程序产生任何影响吗?
在理想情况下,它不会影响操作系统或任何应用程序,但我们并不生活在理想世界中。更可能的原因如上所述。