如何获取 GPU 线程总数？

Question

多个块组合成一个网格，同一个网格内的所有块包含相同数量的线程。一个块中的线程数量是有限的，但网格可用于需要大量线程块并行运行并使用所有可用多处理器的计算。

还

与每个块的最大线程数不同，每个网格的块数限制与最大网格尺寸没有区别。

因此，网格本质上是一种保存所有可供执行的块的构造，它们与处理器内可用的线程块数量无关。

这在计算中很常见。

你经常会有一些任务可以分解成工作单元，而且工作单元的数量比可用的线程数量多得多。然后你只需设置一个调度程序，当另一个块完成时，将一个新的工作块放入处理器块中。

这仍然可以由硬件处理。没有什么可以阻止硬件调度程序知道如何处理对象链接列表，该列表表示“当一个对象完成时，从该列表中获取下一个对象”。

Answer 1

多个块组合成一个网格，同一个网格内的所有块包含相同数量的线程。一个块中的线程数量是有限的，但网格可用于需要大量线程块并行运行并使用所有可用多处理器的计算。

还

与每个块的最大线程数不同，每个网格的块数限制与最大网格尺寸没有区别。

因此，网格本质上是一种保存所有可供执行的块的构造，它们与处理器内可用的线程块数量无关。

这在计算中很常见。

你经常会有一些任务可以分解成工作单元，而且工作单元的数量比可用的线程数量多得多。然后你只需设置一个调度程序，当另一个块完成时，将一个新的工作块放入处理器块中。

这仍然可以由硬件处理。没有什么可以阻止硬件调度程序知道如何处理对象链接列表，该列表表示“当一个对象完成时，从该列表中获取下一个对象”。

相关内容