计算性能优化
DropoutAddLayerNorm融合优化
Flash Attention融合优化
RMSNorm融合优化
SwiGLU融合优化
RoPE融合优化
Matmul_Add融合优化
MoE Token重排性能优化
MoE Token Permute and Unpermute融合优化
Megatron MoE GMM
融合算子API清单
父主题:
使用指导