稠密模型

前期准备

  1. 参考软件安装模型迁移的指导,完成软件安装和模型迁移
  2. MindSpeed目录下的tests_extend文件夹复制到Megatron-LM目录下。
    # {PATH_TO_MEGATRON_LM}: the root path of `Megatron-LM`
    cp -r MindSpeed/tests_extend {PATH_TO_MEGATRON_LM}

    操作步骤

    进入Megatron-LM目录,执行tests_extend/system_tests/llama2/pretrain_llama_tp2_pp4_vpp2.sh脚本。
    cd {PATH_TO_MEGATRON_LM}
    bash tests_extend/system_tests/llama2/pretrain_llama_tp2_pp4_vpp2.sh
    上述脚本pretrain_llama_tp2_pp4_vpp2.sh,包括但不限于以下并行与优化特性
    • 并行配置
      --tensor-model-parallel-size              # 张量并行
      --pipeline-model-parallel-size            # 流水线并行
      --num-layers-per-virtual-pipeline-stage 2 # 每个虚拟流水线阶段的层数为2
      --sequence-parallel                       # 序列并行
    • 融合算子
      --use-flash-attn                          # Flash Attention融合算子
      --normalization RMSNorm                   # RMSNorm归一化
      --use-fused-rmsnorm                       # RMSNorm融合算子
      --swiglu                                  # SwiGLU激活函数
      --use-fused-swiglu                        # SwiGLU融合算子