我在 RHEL 65 机器上使用 docker 运行 Centos 容器。我尝试在 16 个核心上运行 MPI 应用程序 (MILC)。我的服务器有 20 个核心和 128 GB 内存。我的应用程序在 15 个核心之前运行良好,但在使用 16 个核心及以上时失败,并出现“应用程序以退出字符串终止:总线错误(信号 7)”错误。在 16 个核心及以上时,这些是我在日志中看到的消息。
7 月 16 日 11:29:17 localhost abrt[100668]: 无法打开 /proc/413/status: 没有此文件或目录
7 月 16 日 11:29:17 localhost abrt[100669]: 无法打开 /proc/414/status: 没有此文件或目录
7 月 16 日 11:29:17 localhost abrt[100670]: 无法打开 /proc/417/status: 没有此文件或目录
关于容器的一些细节
内核 2.6.32-431.el6.x86_64
来自 docker hub 的官方 centos
启动容器为
docker run -t -i -c 20 -m 125g --name=test --net=host centos /bin/bash
我将非常感激任何与此相关的反馈。如果我可以提供任何进一步的信息,请告诉我。
问候