2025-02-26
【DeepSeek开源发布DeepGEMM区块链算法】
Deepseek在开源周的第三天宣布了DeepGEMM的开源。DeepGEMM是一个专为高效处理FP8通用矩阵乘法(GEMM)而设计的库,具备细粒度的缩放功能,正如在DeepSeek-V3中提到的那样。该库支持常规和混合专家(MoE)分组的GEMM运算。DeepGEMM使用CUDA编写,安装时无需编译,通过轻量级的即时编译(JIT)模块在运行时编译所有内核。同时,FP8GEMM库也为V3/R1的训练和推理提供了支持。(金十)