Rabbitmq 不断崩溃-原因:已完成

Rabbitmq 不断崩溃-原因:已完成

我正在使用 Bitnami chart 在 Kubernetes 集群中运行 RabbitMQ。它经常崩溃,原因仅仅是“已完成”。在迁移到 k8s 之前,Rabbit 是我们基础设施的关键部分之一,运行良好。现在它无法可靠地运行。

  • Kube 集群版本:(1.28.2-do.0在 Digital Ocean 中运行)
  • Helm 图表:bitnamicharts/rabbitmq
  • 图表版本:12.14.0
  • Helm 版本:v3.14.1

用过的values.yaml

# Configure auth to keep same password and use different username
auth:
  username: rabbit
  existingPasswordSecret: rabbitmq-credentials

metrics:
  enabled: true

  serviceMonitor:
    enabled: true
    labels:
      release: kube-prometheus-stack


resources:
  requests:
    cpu: 1
    memory: 512Mi
  limits:
    cpu: 2
    memory: 2048Mi

安装命令

helm upgrade --install rabbitmq -n utils --values values.yml oci://registry-1.docker.io/bitnamicharts/rabbitmq --version 12.14.0

kubectl get pod

rabbitmq-0                   0/1     Completed   0          41h

kubectl describe po rabbitmq-0

    State:          Terminated
      Reason:       Completed
      Exit Code:    0
      Started:      Tue, 19 Mar 2024 19:04:50 +0000
      Finished:     Tue, 19 Mar 2024 20:33:22 +0000

kubectl logs rabbitmq-0

unable to retrieve container logs for containerd://3000a11229497c5441483040153f2d07bde0b4aaca472486a09241c3d37002f6

kubectl get events

No resources found in traders-utils namespace.

Grafana 中的资源使用情况 资源使用情况

什么地方出了问题?

答案1

您可以参考此相关文章因为看起来你遇到了同样的问题。根据 Jehof 的说法,他建议向 pod 添加额外的资源以避免 OOM。这篇文章也是如此一种趋势,他们称这是 RabbitMQ 意外崩溃的原因。

相关内容