我有一个 Ubuntu 服务器,有 16 个 CPU。 (nproc --all
给我看看16
)
我写了一个 bash 脚本,名称test.sh
如下:
#!/bin/bash
while :
do
echo xxx
done
我执行了它:./test.sh >/dev/null &
.
然后我用命令top
监控cpu使用情况,发现一个cpu已经被使用了几乎100%,因为这个进程test.sh
:
6411 me 20 0 11240 3052 2852 R 93.8 0.0 0:11.71 test.sh
%Cpu5 : 96.7 us, 3.3 sy, 0.0 ni, 0.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
我们可以看到,该进程test.sh
已被分配到第5个CPU上,该CPU的利用率几乎为100%。
是否可以将一个繁重的进程分配到多个 CPU 上,以便我们可以更多地利用 CPU?为什么操作系统不将进程分配test.sh
到多个CPU上?是因为进程test.sh
不够重还是我们应该对操作系统进行一些配置来做到这一点?
答案1
单个线程不能在多个核心之间拆分:
需要编写一个程序来拥有多个线程(每个核心一个),或者需要多个程序。如果没有,那么您将不会使用核心。
编写程序以使用更多内核并不是一件小事,而且并非所有问题都可以并行化(编写为在多个内核上运行)。如果一个问题包含 20% 本质上顺序的代码,那么对于无限数量的处理器,它的速度不会比原始执行时间快 20%(速度增加 500%)。然后是开销(线程之间的通信)。
如果您没有任何核心应用程序,那么您最好将其出售,并购买更便宜的机器。
每个核心都会有大量的并行性,来处理单个线程,但这是不可见的。现在,随着我们添加内核,我们正在努力使单个内核变得更快。一开始这很有效。
Unix 系统(例如 Gnu/Linux,例如 Ubuntu)在利用额外核心方面做得很好,最多可达 2→4 个。微软的 Windows 有一个核心用于病毒扫描程序,一个核心用于碎片整理程序,另一个核心用于其他所有程序,这样性能会得到改善。
之后,只有当您拥有专为多核设计的应用程序时,它才会产生影响。
答案2
以下是可以使用多个处理器的 Linux 命令的示例:
make -j
gcc -pipe
当使用 编译大型项目时,该make
选项特别有用且简单gcc
。
-fopenmp
当您调用 gcc 时,将该选项添加到您的构建选项中。尝试在 for 循环上方添加以下编译指示:
#pragma omp parallel for for(i=0; i<8000000000; i++) { ptr[i] = i/10000; }
默认情况下,OpenMP 将在您的计算机中创建与内核一样多的线程,并在它们之间平均分担工作负载。