使用说明
使用说明
- 如果使用动态虚拟化功能(动态/静态虚拟化功能说明请参见vNPU挂载到容器方案),请直接参见动态虚拟化章节,不需要提前使用npu-smi命令创建vNPU。
- 如果使用静态虚拟化功能,需要先参见创建vNPU,再进行挂载到容器操作。
- Atlas 推理系列产品的物理NPU虚拟化出vNPU后,模型在使用vNPU进行推理时可能会出现性能下降。如果出现性能下降的情况,建议使用vir04+vir04_3c或者vir04+vir02+vir02_1c的组合(对应的硬件资源可参见表2)划分vNPU,尽可能的减小性能下降。
- 在训练场景下,用户使用vNPU训练模型时,可以使用AOE调优工具进一步优化模型性能:
使用约束
- 物理NPU虚拟化出vNPU后,不支持再将该物理NPU挂载到容器使用;如果物理机上创建了虚拟机,不支持再将该物理NPU直通到虚拟机使用。
- Atlas 300I Duo 推理卡上两个芯片的工作模式必须一致。即均使用虚拟化实例功能,或均整卡使用。请根据业务自行规划。
- 虚拟化实例模板是用于对整台服务器上所有NPU进行资源切分,不支持不同规格的标卡混插。如Atlas 300V Pro 视频解析卡支持24G和48G内存规格,不支持这两种内存规格的卡混插进行虚拟化;不支持30个AICore的Atlas 训练系列产品和32个AICore的Atlas 训练系列产品混插。
- 当服务器为Atlas 训练系列产品时,仅NPU芯片工作在AMP模式时支持虚拟化功能,不支持SMP模式。查询和设置NPU芯片工作模式操作步骤如下(确保服务器操作系统处于下电状态)。
- 登录iBMC命令行。
- 执行ipmcget -d npuworkmode命令查询NPU芯片的工作模式,若为AMP模式,则无需切换。
- 执行ipmcset -d npuworkmode -v 0命令设置NPU芯片的工作模式为AMP模式。
查询和设置NPU芯片工作模式的详细介绍请参见《Atlas 800 训练服务器 iBMC用户指南(型号 9000)》中的“命令行介绍 > 服务器命令 > 查询和设置NPU芯片工作模式(npuworkmode)”章节。
- 一个vNPU只能被一个任务容器使用,不支持多个任务容器使用同一个vNPU。
父主题: 使用指导