多核机器上内核数较高时 Docker 出现错误

多核机器上内核数较高时 Docker 出现错误

我在 RHEL 65 机器上使用 docker 运行 Centos 容器。我尝试在 16 个核心上运行 MPI 应用程序 (MILC)。我的服务器有 20 个核心和 128 GB 内存。我的应用程序在 15 个核心之前运行良好,但在使用 16 个核心及以上时失败,并出现“应用程序以退出字符串终止:总线错误(信号 7)”错误。在 16 个核心及以上时,这些是我在日志中看到的消息。

7 月 16 日 11:29:17 localhost abrt[100668]: 无法打开 /proc/413/status: 没有此文件或目录

7 月 16 日 11:29:17 localhost abrt[100669]: 无法打开 /proc/414/status: 没有此文件或目录

7 月 16 日 11:29:17 localhost abrt[100670]: 无法打开 /proc/417/status: 没有此文件或目录

关于容器的一些细节

内核 2.6.32-431.el6.x86_64

来自 docker hub 的官方 centos

启动容器为

docker run -t -i -c 20 -m 125g --name=test --net=host centos /bin/bash

我将非常感激任何与此相关的反馈。如果我可以提供任何进一步的信息,请告诉我。

问候

相关内容