下载
中文
注册

特性列表

为确保MindSpeed在昇腾设备上实现大模型训练的全方位加速与优化,以下特性列表概述了关键功能与优势,旨在从计算性能、内存资源、通信性能、并行算法以及关键场景等多个维度,全面提升大模型训练的效率与稳定性。

表1 特性列表

特性类别

特性说明

特性名称

并行算法优化

提供昇腾亲和的多维度并行加速

内存资源优化

支持高效内存算法,最大化性能无损

通信性能优化

发挥极致通信性能,实现计算与通信并行

计算性能优化

全场景高性能融合算子加速库,昇腾亲和优化

关键场景

额外支持的重要训练场景

Alibi位置编码

目前MindSpeed支持Megatron MoE和Deepspeed MoE两种实现,可通过如下参数进行配置。

--moe-model-type deepspeed_moe      # 使用DeepSpeed MoE实现方案
--moe-model-type megatron_moe       # 使用Megatron MoE实现方案