当节点有足够的可用资源时，为什么 Pod 会由于资源问题而无法调度？

Question 1

根据 kubernetes文档：

如何调度有资源请求的 Pod

当您创建 Pod 时，Kubernetes 调度程序会选择一个节点供 Pod 运行。每个节点对每种资源类型都有最大容量：它可以为 Pod 提供的 CPU 和内存量。调度程序确保对于每种资源类型，调度容器的资源请求总和小于节点的容量。请注意，尽管节点上实际内存或 CPU 资源使用率非常低，但如果容量检查失败，调度程序仍然会拒绝将 Pod 放置在节点上。当资源使用量随后增加时（例如，在请求率达到每日峰值期间），这可以防止节点出现资源短缺的情况。

有关如何运行 pod 限制的更多信息，请参见这里。

更新：

可以通过重新调整内存限制并添加符合您偏好的驱逐策略来优化资源消耗。您可以在 kubernetes 文档中找到更多详细信息这里和这里。

更新 2：

为了更好地理解为什么调度程序拒绝将 Pod 放置在节点上，我建议在 AKS 集群中启用资源日志。请查看 AKS 的指南文档. 从常见日志中查找kube-scheduler日志以查看更多详细信息。

Answer

根据 kubernetes文档：

如何调度有资源请求的 Pod

当您创建 Pod 时，Kubernetes 调度程序会选择一个节点供 Pod 运行。每个节点对每种资源类型都有最大容量：它可以为 Pod 提供的 CPU 和内存量。调度程序确保对于每种资源类型，调度容器的资源请求总和小于节点的容量。请注意，尽管节点上实际内存或 CPU 资源使用率非常低，但如果容量检查失败，调度程序仍然会拒绝将 Pod 放置在节点上。当资源使用量随后增加时（例如，在请求率达到每日峰值期间），这可以防止节点出现资源短缺的情况。

有关如何运行 pod 限制的更多信息，请参见这里。

更新：

可以通过重新调整内存限制并添加符合您偏好的驱逐策略来优化资源消耗。您可以在 kubernetes 文档中找到更多详细信息这里和这里。

更新 2：

为了更好地理解为什么调度程序拒绝将 Pod 放置在节点上，我建议在 AKS 集群中启用资源日志。请查看 AKS 的指南文档. 从常见日志中查找kube-scheduler日志以查看更多详细信息。

Question 2

我发现，查看可用容量时，需要注意Allocatable，而不是Capacity。来自 Azure 支持：

请查看此文档“资源预留”，如果我们按照该文档中的示例（使用每个节点 8GB 的整数）：

0.75 + (0.25*4) + (0.20*3) = 0.75GB + 1GB + 0.6GB = 2.35GB / 8GB = 29.37% reserved

对于 8GB 的服务器，保留的量约为 29.37%，这意味着：

节点预留的内存量 = 29.37% * 8000 = 2349。可分配剩余内存 =5651前 9 个 Pod 将使用 =9 * 528 = 4752 第一个 Pod 之后的可分配剩余内存 = 899（kubectl describe node 中显示的可分配内存应为 OS 预留后可用的数量）

在最后一个数字中，我们必须考虑运行所需的操作系统预留，因此在使用操作系统预留内存后，可能没有足够的空间容纳节点上的更多 pod，因此出现消息。

根据计算结果，这将导致预期的行为。

Answer

我发现，查看可用容量时，需要注意Allocatable，而不是Capacity。来自 Azure 支持：

请查看此文档“资源预留”，如果我们按照该文档中的示例（使用每个节点 8GB 的整数）：

0.75 + (0.25*4) + (0.20*3) = 0.75GB + 1GB + 0.6GB = 2.35GB / 8GB = 29.37% reserved

对于 8GB 的服务器，保留的量约为 29.37%，这意味着：

节点预留的内存量 = 29.37% * 8000 = 2349。可分配剩余内存 =5651前 9 个 Pod 将使用 =9 * 528 = 4752 第一个 Pod 之后的可分配剩余内存 = 899（kubectl describe node 中显示的可分配内存应为 OS 预留后可用的数量）

在最后一个数字中，我们必须考虑运行所需的操作系统预留，因此在使用操作系统预留内存后，可能没有足够的空间容纳节点上的更多 pod，因此出现消息。

根据计算结果，这将导致预期的行为。

当节点有足够的可用资源时，为什么 Pod 会由于资源问题而无法调度？

答案1

如何调度有资源请求的 Pod

答案2

相关内容