CUDA MODE笔记First Post: 2024-10-26Last Update: 2024-10-27lec1比较重要的工具: autograd profiler pytorch profiler ncu profiler torch complie lec2123456789gridDim.x:线程网络X维度上线程块的数量gridDim.y-线程网络Y维度上线程块的数量blockDim.x-一个线程块X维度上的线程数量blockDim.y-一个线程块Y维度上的线程数量blockIdx.x-线程网络X维度上的线程块索引blockIdx.y-线程网络Y维度上的线程块索引threadIdx.x-线程块X维度上的线程索引threadIdx.y-线程块Y维度上的线程索引 ∧ ≡