CUDA MODE笔记

First Post:

Last Update:

lec1

比较重要的工具:

  • autograd profiler
  • pytorch profiler
  • ncu profiler
  • torch complie

lec2

1
2
3
4
5
6
7
8
9
gridDim.x:线程网络X维度上线程块的数量
gridDim.y-线程网络Y维度上线程块的数量
blockDim.x-一个线程块X维度上的线程数量
blockDim.y-一个线程块Y维度上的线程数量

blockIdx.x-线程网络X维度上的线程块索引
blockIdx.y-线程网络Y维度上的线程块索引
threadIdx.x-线程块X维度上的线程索引
threadIdx.y-线程块Y维度上的线程索引