我刚刚学习了一些关于低级语言的知识,我注意到 gcc 可以指定 -march 和 -mtune 参数来优化特定 CPU 系列的软件。
但我也发现有人这么说从源代码构建程序不会比下载二进制文件明显更快。当然,能够针对系统中的 CPU 进行优化的软件会显着提高速度,尤其是在ffmpeg
使用 AVX 等相当依赖于微架构的功能的软件中?
我想知道的是,包管理器上的二进制文件是否以某种方式针对多个微架构进行了优化?包管理器是否下载特定于我的系统微架构的二进制文件?
答案1
分发包是参考预先确定的基线构建的(参见Debian 的架构基线例如)。因此,在 Debian 中,amd64
软件包的目标是通用 x86-64 CPU,具有 SSE2,但不具有 SSE3 或更高版本;i386
软件包针对通用 i686 CPU,不带 MMX 或 SSE。一般来说,使用编译器默认值,因此调整可能会随着编译器本身的发展而发展。
然而可以构建特定于 CPU 的优化提供显着优势的软件包,以利用较新的 CPU。这是通过提供多种实现而不是依赖编译器优化,并在运行时在它们之间进行选择来完成的:打包的软件检测正在运行的 CPU 并调整它使用的代码路径以利用它(例如,参见ffmpeg
)libswscale/x86/swscale.c
。在某些架构上,ld.so
本身对此有所帮助:它可以自动加载优化的库(如果可用),例如i386
在支持 SSE 的 CPU 上运行的架构系统上。
大多数(如果不是全部)包管理器都没有注意到这一切;他们下载给定架构的软件包并安装它,而不考虑运行系统的 CPU。