算子开发:nsight-compute 发表于 2026-01-02 分类于 GPU , 编译 阅读次数: 本文字数: 167 阅读时长 ≈ 1 分钟 算子开发过程中,一个核心环节是借助于Nsight compute等成熟profiling工具来做性能分析。本文结合CUDA matmul kernel教程中的例子来分析nsight compute工具的使用。 参考资料 CUDA programming guide CUDA profiling guide GPU-MODE: Nvidia-profiling