从Linux内核的角度来看，用户程序如何与CUDA GPU通信？

Question

应用程序在启动时向内核请求mmap一组缓冲区，创建此映射是一项特权操作。

正常操作只是用数据（例如纹理、顶点或命令）填充这些缓冲区，最后进行单个内核调用来启动提交的命令队列。此启动选通是唯一执行的寄存器访问，其他所有内容都是共享内存。

GPU 有自己的基本 MMU，以确保命令无法引用属于另一个上下文的数据，除非需要（例如，将游戏中的渲染目标与覆盖层中的渲染目标组合在一起的合成器，并将结果写入到本地）屏幕缓冲区）。

对于仅计算的工作负载，相同的机制可以正常工作，命令队列只是不以“将数据发送到屏幕”结束，而是以“将数据返回到主机”结束。

Answer 1

应用程序在启动时向内核请求mmap一组缓冲区，创建此映射是一项特权操作。

正常操作只是用数据（例如纹理、顶点或命令）填充这些缓冲区，最后进行单个内核调用来启动提交的命令队列。此启动选通是唯一执行的寄存器访问，其他所有内容都是共享内存。

GPU 有自己的基本 MMU，以确保命令无法引用属于另一个上下文的数据，除非需要（例如，将游戏中的渲染目标与覆盖层中的渲染目标组合在一起的合成器，并将结果写入到本地）屏幕缓冲区）。

对于仅计算的工作负载，相同的机制可以正常工作，命令队列只是不以“将数据发送到屏幕”结束，而是以“将数据返回到主机”结束。

相关内容