Kubernetes 限制整个集群中同时重启的 Pod 数量

Question

当 Pod 可以在任何地方调度时，就会遇到这种问题。使用亲和性规则，您走在了正确的轨道上。

您可以通过让部署副本集中的 Pod 彼此表达负亲和性（因此它们分散在节点之间）来使这些 Pod 彼此表达反亲和性。这会使调度变得有些繁重，但确实可以防止 Pod 在节点丢失时导致级联故障。它还可以很好地确保它们分散在故障域中，但这更像是副作用。

但是，还有一种更好的方法可以实现这一点 - 通过 pod 拓扑分布约束。通过指定分布约束，调度程序将确保 pod 在故障域（AZ 或节点）之间保持平衡，并且无法平衡 pod 会导致调度失败。

可以这样编写代码，保证 Pod 分布在节点之间，并且节点故障不会导致“聚集”。看一下这个示例 Pod：

kind: Pod
apiVersion: v1
metadata:
  name: mypod
  labels:
    foo: bar
spec:
  topologySpreadConstraints:
  - maxSkew: 1
    topologyKey: zone
    whenUnsatisfiable: DoNotSchedule
    labelSelector:
      matchLabels:
        foo: bar
  - maxSkew: 1
    topologyKey: node
    whenUnsatisfiable: DoNotSchedule
    labelSelector:
      matchLabels:
        foo: bar
  containers:
  - name: pause
    image: k8s.gcr.io/pause:3.1

如果您不希望部署及其副本集与同一节点上的其他部署一起调度，则可以将此与亲和性规则结合使用，从而进一步减少“聚集”效应。在这种情况下，软反亲和性通常是合适的，因此调度程序将“尽量不”将这些工作负载放在一起。

Answer 1

当 Pod 可以在任何地方调度时，就会遇到这种问题。使用亲和性规则，您走在了正确的轨道上。

您可以通过让部署副本集中的 Pod 彼此表达负亲和性（因此它们分散在节点之间）来使这些 Pod 彼此表达反亲和性。这会使调度变得有些繁重，但确实可以防止 Pod 在节点丢失时导致级联故障。它还可以很好地确保它们分散在故障域中，但这更像是副作用。

但是，还有一种更好的方法可以实现这一点 - 通过 pod 拓扑分布约束。通过指定分布约束，调度程序将确保 pod 在故障域（AZ 或节点）之间保持平衡，并且无法平衡 pod 会导致调度失败。

可以这样编写代码，保证 Pod 分布在节点之间，并且节点故障不会导致“聚集”。看一下这个示例 Pod：

kind: Pod
apiVersion: v1
metadata:
  name: mypod
  labels:
    foo: bar
spec:
  topologySpreadConstraints:
  - maxSkew: 1
    topologyKey: zone
    whenUnsatisfiable: DoNotSchedule
    labelSelector:
      matchLabels:
        foo: bar
  - maxSkew: 1
    topologyKey: node
    whenUnsatisfiable: DoNotSchedule
    labelSelector:
      matchLabels:
        foo: bar
  containers:
  - name: pause
    image: k8s.gcr.io/pause:3.1

如果您不希望部署及其副本集与同一节点上的其他部署一起调度，则可以将此与亲和性规则结合使用，从而进一步减少“聚集”效应。在这种情况下，软反亲和性通常是合适的，因此调度程序将“尽量不”将这些工作负载放在一起。

Kubernetes 限制整个集群中同时重启的 Pod 数量

答案1

相关内容