OpenStack 上的 Kubernetes CSI 向节点添加了错误的节点 ID 注释

OpenStack 上的 Kubernetes CSI 向节点添加了错误的节点 ID 注释

我正在尝试配置 Cinder CSI 插件(https://github.com/kubernetes/cloud-provider-openstack/blob/master/docs/using-cinder-csi-plugin.md) 在我的 Kubernetes 集群(安装在 OpenStack 实例上)上。

一切正常(PV、PVC 和实际的 Cinder 卷都创建得很好),但是当csi-attacher尝试将我的 Cinder 卷附加到我的节点时,失败了:

Error processing "csi-0c1aee9c7e99bc90a586541a4bb7974e38978dc3a2c441a1ad1413d7435d886c": failed to attach: rpc error: code = Unknown desc = failed to attach 445d9931-9e32-48b5-b765-209a4526691f volume to i-0031336c compute: Resource not found

但请注意,卷 ID 是正确的:

> cinder list | grep 445d9931-9e32-48b5-b765-209a4526691f
| 445d9931-9e32-48b5-b765-209a4526691f | available | pvc-788eb00a-99bc-11e9-b7dc-fa163eb3415c | 1    | classic     | false    |                                      |

我的节点不是i-0031336c一个实际的 UUID:

> nova list | grep worker03-dev
| 9d7cd2bb-a365-4276-86ed-f4884132c361 | worker03-dev     | ACTIVE | -          | Running     | Ext-Net=<redacted>    |

我不知道为什么,但是有些事情(我还不是 CSI 方面的专家)正在向我的节点添加具有错误 ID 的注释:

> kubectl get node worker03-dev.node.consul -o yaml | grep nodeid
    csi.volume.kubernetes.io/nodeid: '{"cinder.csi.openstack.org":"i-0031336c"}'

从主机查询 OpenStack API 时,它也返回正确的 UUID:

root@worker03-dev ~ # curl -s 169.254.169.254/openstack/latest/meta_data.json | jq '.uuid'
"9d7cd2bb-a365-4276-86ed-f4884132c361"

我是不是完全搞错了什么?

我运行以下 CSI 容器:

image: quay.io/k8scsi/csi-attacher:v1.1.1
image: quay.io/k8scsi/csi-provisioner:v1.0.1
image: quay.io/k8scsi/csi-snapshotter:v1.0.1
image: quay.io/k8scsi/csi-node-driver-registrar:v1.1.0
image: docker.io/k8scloudprovider/cinder-csi-plugin:latest

(我开始v1.0.1对所有k8scsi容器进行升级,但尝试升级其中一些,但没有成功)

答案1

问题不在于 CSI,而在于我的cloud-init配置,它获取的是 EC2 元数据而不是 OpenStack 元数据(我/etc/cloud/cloud.cfg.d/90_dpkg.cfg指的是Ec2而不是OpenStack),因此无法检索到好的实例 ID:

root@worker03-dev ~ # cat /var/lib/cloud/data/instance-id 
i-0031336c

修复问题后,cloud-init正在检索正确的实例ID:

root@worker03-dev ~ # cat /var/lib/cloud/data/instance-id 
9d7cd2bb-a365-4276-86ed-f4884132c361

现在正确的 NodeID 已附加到我的节点。

我不知道为什么我的云提供商(OVH)返回了错误的 EC2 元数据 URL 信息:

root@worker03-dev ~ # curl http://169.254.169.254/latest/meta-data/instance-id
i-0031336c

相关内容