我已编译并运行这些命令,但它们的内容对我来说有点神秘。
流程intel-gpu-overlay
读取如下:15R, 16B, 41ms waits
。什么是 an R
,什么是 a B
,等待时间表示什么?
它的 CPU 利用率:152%(我猜这与我从顶部得到的结果相同)。渲染:32%,比特流:6%,blt:6%。什么样的代码会导致这些值出现瓶颈,当它们出现时系统会采取什么行为?
这是 intel-gpu-top 的示例:
render busy: 23%: ████▋ render space: 12/16384 task percent busy GAM: 29%: █████▉ vert fetch: 1380772913 (5386667/sec) CS: 23%: ████▋ prim fetch: 350972637 (1368891/sec) GAFS: 9%: █▉ VS invocations: 1375586768 (5385212/sec) TSG: 8%: █▋ GS invocations: 0 (0/sec) VFE: 7%: █▌ GS prims: 0 (0/sec) SVG: 3%: ▋ CL invocations: 677098924 (2648400/sec) VS: 3%: ▋ CL prims: 682224019 (2663834/sec) URBM: 2%: ▌ PS invocations: 9708568482932 (34396218804/sec) VF: 2%: ▌ PS depth pass: 15549624948405 (58732230331/sec) SDE: 0%: CL: 0%: SF: 0%: TDG: 0%: RS: 0%: GAFM: 0%: SOL: 0%:
答案1
摘自OP评论中给出的链接。
我也很好奇,所以这里只是我可以从其中获取的一些内容参考手册。同样令人感兴趣的是英特尔 GPU 工具源,特别是lib/instdone.c
它描述了所有 Intel GPU 型号中可能出现的内容。这个补丁对翻译所有这些首字母缩略词也非常有帮助!
有些可能是错误的,如果有更懂行的人可以插话,我会很高兴!当我学习这些东西时,我会回来更新更多答案。
首先,右边三行:
- 这渲染空间可能由常规 3D 操作使用。
- 从谷歌搜索来看,比特流好像是关于音频解码的?这是一个非常通用的术语,很难通过查询找到。但它没有出现在我的 GPU (Skylake HD 530) 上,因此它可能不会无处不在。
- 这碎块在卷中描述。 11 并且似乎负责 2D 操作的硬件加速(位块传输)。
固定功能 (FF) 管道单元(老式 GPU 功能):
- 视音频:顶点获取器(卷 1),3D Pipeline 中的第一个 FF 单元,负责从内存中获取顶点数据。
- 对比:顶点着色器(vol.1),在 GPU 绘制的每个图元的顶点上进行计算。 GPU 上相当标准的操作。
- HS:船体着色器
- 技术工程师:曲面细分引擎
- DS:域着色器
- GS:几何着色器
- 索尔:流输出逻辑
- 化学发光:剪辑单元
- 顺丰:条带和扇子(vol.1),FF单元,主要功能是将条带、扇形等基元拓扑分解为基元或对象。
用于线程和管道管理的单元,适用于 FF 单元和 GPGPU(请参阅英特尔开源高清显卡程序员手册为一个很多有关这一切如何运作的信息):
- CS:命令流(第 1 卷),图形处理引擎的功能单元,用于获取命令、解析命令并将它们路由到适当的管道。
- TDG:线程调度程序
- 电压反馈:视频前端
- TSG:线程生成器
- 城市建筑模型:统一返回缓冲区管理器
其他的东西 :
- 伽姆:见GFX 页面漫游器(第 5 卷),也称为内存仲裁器,与 GPU 如何跟踪其内存页面有关,看起来与TLB(也可以看看SLAT)对你的内存来说。
- 东南DE:南方显示引擎;根据卷。 12,“南方显示引擎支持热插拔检测、GPIO、GMBUS、面板电源排序和背光调制”。
学分: