使用说明

如果使用动态虚拟化功能（动态/静态虚拟化功能说明请参见vNPU挂载到容器方案），请直接参见动态虚拟化章节，不需要提前使用npu-smi命令创建vNPU。
如果使用静态虚拟化功能，需要先参见创建vNPU，再进行挂载到容器操作。
Atlas 推理系列产品（配置Ascend 310P AI处理器）的物理NPU虚拟化出vNPU后，模型在使用vNPU进行推理时可能会出现性能下降。如果出现性能下降的情况，建议使用vir04+vir04_3c或者vir04+vir02+vir02_1c的组合（对应的硬件资源可参见表2）划分vNPU，尽可能的减小性能下降。
在训练场景下，用户使用vNPU训练模型时，可以使用AOE调优工具进一步优化模型性能：
- 使用PyTorch框架训练时，可以参见性能调优优化性能。
- 使用TensorFlow框架训练时，可以参见性能调优优化性能。
- 使用MindSpore框架训练时，可以参见性能调优优化性能。

物理NPU虚拟化出vNPU后，不支持再将该物理NPU挂载到容器使用；如果物理机上创建了虚拟机，不支持再将该物理NPU直通到虚拟机使用。
Atlas 300I Duo 推理卡上两个芯片的工作模式必须一致。即均使用虚拟化实例功能，或均整卡使用。请根据业务自行规划。
虚拟化实例模板是用于对整台服务器上所有NPU进行资源切分，不支持不同规格的标卡混插。如Atlas 300V Pro 视频解析卡支持24G和48G内存规格，不支持这两种内存规格的卡混插进行虚拟化；不支持30个AICore的Atlas 训练系列产品和32个AICore的Atlas 训练系列产品混插。
当服务器为Atlas 训练系列产品时，仅NPU芯片工作在AMP模式时支持虚拟化功能，不支持SMP模式。查询和设置NPU芯片工作模式操作步骤如下（确保服务器操作系统处于下电状态）。
1. 登录iBMC命令行。
2. 执行ipmcget -d npuworkmode命令查询NPU芯片的工作模式，若为AMP模式，则无需切换。
3. 执行ipmcset -d npuworkmode -v 0命令设置NPU芯片的工作模式为AMP模式。
查询和设置NPU芯片工作模式的详细介绍请参见《Atlas 800 训练服务器 iBMC用户指南（型号 9000）》中的“命令行介绍 > 服务器命令 > 查询和设置NPU芯片工作模式（npuworkmode）”章节。

父主题： 使用指导