我正在尝试在 ECS 集群中创建一个服务来运行使用弹性推理加速器 (EIA) 的任务。但是,当我尝试创建该服务时,出现以下错误:
我已经阅读文档,并且我知道同一个 EC2 实例中不能有超过 5 个加速器,因此我为此创建了一个全新的 EC2。
但我仍然有问题。如果我从任务定义中删除 EI 加速器,一切都会正常。我的任务定义参考如下:
"resourceRequirements": [
{
"type": "InferenceAccelerator",
"value": "device-gpu2"
}
在容器定义中:
"eia": "device-gpu2"
附言:我还仔细检查了我的 cloudwatch 日志组是否已创建。我还有其他几个 EC2 实例,它们使用相同的配置完美运行,所以这很奇怪,我确信这肯定是一个限制问题,但 AWS 控制台却出现了错误的错误消息。
我有另一个 EC2 实例,该实例通过 ECS 连接了 5 个加速器,并且运行正常。您有什么想法吗?