kubectl

如何清除 kubernetes 中的旧图像 io.containerd.snapshotter.v1.overlayfs 文件夹
kubectl

如何清除 kubernetes 中的旧图像 io.containerd.snapshotter.v1.overlayfs 文件夹

漏洞检查正在从我们的 Kubernetes 节点上的 /apps/data/containerd/io.containerd.snapshotter.v1.overlayfs/snapshots/XX/fs/usr/lib 中获取旧版本的应用程序/软件。 我们无法手动清理 kubernetes 集群中的快照文件夹,那么我们如何触发 GC 或任何其他进程来清理旧图像? 使用最新的应用程序/软件准备好吊舱并重新部署。 kubectl -n my_ns get pods 这将返回最新的 pod。 kubectl -n my_ns exec -it <pod...

Admin

RKE2 错误 - 等待 API 服务器可用等待检索 kube-proxy 配置;服务器尚未准备好
kubectl

RKE2 错误 - 等待 API 服务器可用等待检索 kube-proxy 配置;服务器尚未准备好

问题 1 在高可用性 RKE2 Kubernetes 集群中,我配置了一个负载均衡器 (1LB) 和三个主节点。最初,所有组件都按预期运行。但是,在重新启动其中一个节点后,它无法与现有 Kubernetes 集群重新建立连接。执行 systemctl restart rke2-server 后,该节点作为只有一个节点的新服务器启动。 在具有三个节点的高可用性 (HA) RKE2 集群配置中,两个节点发生故障会导致 etcd 服务器不可用。经检查,API 服务器和 ETCD 服务器均报告为不可用。因此,我无法管理 Kubernetes 集群。这种情况导致集群上...

Admin

Kubectl 为水平 pod 指定内存
kubectl

Kubectl 为水平 pod 指定内存

我见过kubectl可以指定诸如目标平均 CPU 利用率等标志的文档: kubectl autoscale deployment <deployment> --cpu-percent=50 --min=1 --max=10 为什么没有内存标志? ...

Admin

尝试在 Ubuntu 22 上从头设置 K8 集群,但 kubelet 无法注册节点
kubectl

尝试在 Ubuntu 22 上从头设置 K8 集群,但 kubelet 无法注册节点

kubelet 服务显示以下错误 Apr 05 14:13:06 estk8worker0 kubelet[90209]: E0405 14:13:06.863258 90209 kubelet_node_status.go:92] "Unable to register node with API server" err="Post \"https://:6443/api/v1/nodes\": dial tcp :6443: connect: connection refused" node="estk8worker0" Apr 05 14:13:0...

Admin

Kube-apiserver 无法验证请求,所有工作人员都未就绪状态
kubectl

Kube-apiserver 无法验证请求,所有工作人员都未就绪状态

所有工作者状态都是NotReady。 工作节点上的 Kubelet 显示以下问题。 检查下面显示的其中一个工作进程 kubelet。 似乎是 kubelet 无法访问 kube-apiserver $ curl -k https://192.168.1.50:8443/healthz curl: (7) Failed to connect to 192.168.1.50 port 8443 after 0 ms: Connection refused 两个 kube-apiserver 日志如下 证书似乎有问题,几天前我们执行了 kubeadm ...

Admin

无法解析 Kubernetes 中的服务
kubectl

无法解析 Kubernetes 中的服务

我有一个想要连接到 Redis 的 pod,但是我们改用 dragonfly,但它无法做到这一点。 [2024-04-01 14:34:28.421 DEBUG common_server/src/db/redis_manager.rs:112] creating redis pool with CLIENT NAME: rust-rpauth-5b56497fcf-nz8gt|strict|2 [2024-04-01 14:34:34.444 ERROR common_server/src/db/redis_manager.rs:468] connecti...

Admin

Kubernetes 中 PVC 处于终止状态,PV 处于绑定状态
kubectl

Kubernetes 中 PVC 处于终止状态,PV 处于绑定状态

我有一个处于终止状态的 PVC(因为它被其他 3 个 pod 引用),并且 PV 处于绑定状态。PV 具有保留回收策略。 另外我不确定 PVC 终止的原因,没有可用的事件。 我可以知道将 PVC 恢复到绑定状态的步骤吗?如果您能提供这些步骤,那将非常有帮助。 ...

Admin

kubeProxy 无法获取节点 IP
kubectl

kubeProxy 无法获取节点 IP

我目前正在运行一个 k8s 集群设置,其中安装了 3 个主节点和 3 个工作节点,并安装了 Kubeadm。每个主节点负责管理一个工作节点。在我的一个工作节点中,最近出现了一个以前从未见过的错误。 I0226 10:03:50.904111 1066929 round_trippers.go:510] HTTP Trace: Dial to tcp:127.0.0.1:6443 succeed I0226 10:03:50.918311 1066929 round_trippers.go:553] GET https://127.0.0.1:6443/api...

Admin

containerd 和 kubelet 服务重启后 Pod 也会重启
kubectl

containerd 和 kubelet 服务重启后 Pod 也会重启

随着配置更改的发生,containerd 和 kubelet 服务都需要重新启动。重新启动服务后,节点上运行的所有 pod 都会重新启动。我检查了事件,如下所示。我无法找到容器也重新启动的原因。有人可以提出建议吗? 7m29s Normal SandboxChanged pod/fluentd-ds-bqs9r Pod sandbox changed, it will be killed and re-created. 7m29s Normal Killing pod/fluentd-ds-bqs9r...

Admin

Kubeadm 和 kubectl - 连接被拒绝
kubectl

Kubeadm 和 kubectl - 连接被拒绝

我在两台虚拟机(kvm)上部署了一个基本集群,其中一台虚拟机被指定为主服务器,并使用其上的控制平面kubeadm init- 一切似乎都启动正确,但是当我尝试使用进行最基本的检查时kubectl,我收到连接被拒绝错误。 更新2: 成功了,但不明白为什么 - 最初,我使用 sudo 以专用用户身份运行所有程序。当我切换到 root(su root)并重复这些步骤时,一切都开始正常工作。是什么导致了这种变化,它是否与处于 root 环境而不是用户环境有关?不同的主目录?工作目录?我在这里不知所措 更新 1:最小失败示例: 这次我又创建了一台运行 ubuntu 2...

Admin

仅向 Kubernetes 集群用户和 Pod 授予必要的权限的最佳实践?
kubectl

仅向 Kubernetes 集群用户和 Pod 授予必要的权限的最佳实践?

尽管我是 Kubernetes 集群的新手,但我还是被指派为我的实验室部署和管理一个集群。目前,带有使用 gpu 的 pytorch 容器的 pod(这些将是我设置中最典型的 pod 类型)在集群上运行良好,尽管存在一些权限问题: 例如,一个用户tom可以删除另一个用户部署的 pod jerry。 容器以 的身份运行root。我们再举jerry个例子。假设jerry部署了一个 pod,其容器清单中挂载了一个目录,其中包含其他用户拥有的文件。以 身份运行意味着root不仅jerry可以修改自己的文件,还可以修改 拥有的文件,tom甚至是spike和拥有的文件...

Admin

删除集群后如何保持.kube/config 整洁?
kubectl

删除集群后如何保持.kube/config 整洁?

在 Microsoft Windows 中,我发现当我创建和删除 AKS 集群时,我的.kube/config文件正在积累我已删除的内容的上下文条目。 我尝试使用以下命令,但之后我仍然在文件中找到上下文的条目,.kube/config尽管 kubectl 不再列出上下文。 kubectl config delete-context someContextNameHere kubectl config unset contexts.someContextNameHere 之后,使用该kubectl config get-contexts命令确实表明它们是消失...

Admin

自定义资源的 Kubernetes 模板
kubectl

自定义资源的 Kubernetes 模板

在 Kubernetes 中有一种方法可以获取核心资源的模板,如下所示: kubectl create secret generic --dry-run=client --output=yaml 有没有办法对自定义资源做同样的事情?由于 crossplane,我有很多 CRD,它们在最初应用资源时有很多默认值。目前,如果我想创建一个,我会设置类型并尝试让最小规范起作用。 假设我的 crd 是:postgresqls.database.example.com 我已经尝试解释但最后显示的是我想要的类型,就像一个真正的“可应用” yaml。 kubectl ex...

Admin

如何使用 Rancher CLI 自动更新部署中的 Docker 镜像标签
kubectl

如何使用 Rancher CLI 自动更新部署中的 Docker 镜像标签

我们有一些使用 rancher 管理的开发和质量保证 k8s 集群。 每次发布生产版本时,我们的团队都会使用 rancher web ui 来更改镜像标签版本并更新应用程序。 我们希望根据需要创建新版本的应用程序名称来自动化此过程。 请提出任何自动化建议。我向 chatgpt 提问,但它给出了一个简单的 rancher cli 命令,如下所示,其中它使用该rancher kubectl命令来应用清单文件。 sed -i 's|old-image:tag|new-image:tag|' deployment.yaml rancher kubectl apply...

Admin