如何判断为什么 Kubernetes 活性探测得到 HTTP 503 而日志显示 200 OK？

Question

经过进一步深入研究后，我们发现 Docker 守护进程似乎因为超出了系统日志中记录的内存限制而终止了容器：

Jan 15 12:12:40 node01 kernel: [2411297.634996] httpd invoked oom-killer: gfp_mask=0x14200ca(GFP_HIGHUSER_MOVABLE), nodemask=(null), order=0, oom_score_adj=998
[...]
Jan 15 12:12:40 node01 kernel: [2411297.672084] oom_reaper: reaped process 519 (httpd), now anon-rss:0kB, file-rss:0kB, shmem-rss:68kB

为什么 httpd 突然超出内存限制仍是一个问题，但超出了这里的范围。
为什么 Kubernetes 不会报告因超出内存限制而被终止的容器（根据文档的 lastState 报告) 对我来说仍是一个问题。
日志可能不会显示任何 503 答案的输出，因为容器在将其写入 stdout/stderr 之前就被 Docker 守护进程杀死了。
如果内存不足是原因，我仍然无法理解这里事件的顺序，因为它确实首先收到正常关闭信号，并且 kubelet 将响应记录为 503（而不是超时）。

即使这是原因，对于 Kubernetes 管理员来说，追查它也会是一个非常糟糕的用户体验。

Answer 1

经过进一步深入研究后，我们发现 Docker 守护进程似乎因为超出了系统日志中记录的内存限制而终止了容器：

Jan 15 12:12:40 node01 kernel: [2411297.634996] httpd invoked oom-killer: gfp_mask=0x14200ca(GFP_HIGHUSER_MOVABLE), nodemask=(null), order=0, oom_score_adj=998
[...]
Jan 15 12:12:40 node01 kernel: [2411297.672084] oom_reaper: reaped process 519 (httpd), now anon-rss:0kB, file-rss:0kB, shmem-rss:68kB

为什么 httpd 突然超出内存限制仍是一个问题，但超出了这里的范围。
为什么 Kubernetes 不会报告因超出内存限制而被终止的容器（根据文档的 lastState 报告) 对我来说仍是一个问题。
日志可能不会显示任何 503 答案的输出，因为容器在将其写入 stdout/stderr 之前就被 Docker 守护进程杀死了。
如果内存不足是原因，我仍然无法理解这里事件的顺序，因为它确实首先收到正常关闭信号，并且 kubelet 将响应记录为 503（而不是超时）。

即使这是原因，对于 Kubernetes 管理员来说，追查它也会是一个非常糟糕的用户体验。

如何判断为什么 Kubernetes 活性探测得到 HTTP 503 而日志显示 200 OK？

答案1

相关内容