下载
中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助
昇腾小AI

使用说明

使用说明

  • 如果使用动态虚拟化功能(动态/静态虚拟化功能说明请参见vNPU挂载到容器方案),请直接参见动态虚拟化章节,不需要提前使用npu-smi命令创建vNPU。
  • 如果使用静态虚拟化功能,需要先参见创建vNPU,再进行挂载到容器操作。
  • Atlas 推理系列产品的物理NPU虚拟化出vNPU后,模型在使用vNPU进行推理时可能会出现性能下降。如果出现性能下降的情况,建议使用vir04+vir04_3c或者vir04+vir02+vir02_1c的组合(对应的硬件资源可参见表2)划分vNPU,尽可能的减小性能下降。
  • 在训练场景下,用户使用vNPU训练模型时,可以使用AOE调优工具进一步优化模型性能:
    • 使用PyTorch框架训练时,可以参见性能调优优化性能。
    • 使用TensorFlow框架训练时,可以参见性能调优优化性能。
    • 使用MindSpore框架训练时,可以参见性能调优优化性能。

使用约束

  • 物理NPU虚拟化出vNPU后,不支持再将该物理NPU挂载到容器使用;如果物理机上创建了虚拟机,不支持再将该物理NPU直通到虚拟机使用。
  • Atlas 300I Duo 推理卡上两个芯片的工作模式必须一致。即均使用虚拟化实例功能,或均整卡使用。请根据业务自行规划。
  • 虚拟化实例模板是用于对整台服务器上所有NPU进行资源切分,不支持不同规格的标卡混插。如Atlas 300V Pro 视频解析卡支持24G和48G内存规格,不支持这两种内存规格的卡混插进行虚拟化;不支持30个AICore的Atlas 训练系列产品和32个AICore的Atlas 训练系列产品混插。
  • 当服务器为Atlas 训练系列产品时,仅NPU芯片工作在AMP模式时支持虚拟化功能,不支持SMP模式。查询和设置NPU芯片工作模式操作步骤如下(确保服务器操作系统处于下电状态)。
    1. 登录iBMC命令行。
    2. 执行ipmcget -d npuworkmode命令查询NPU芯片的工作模式,若为AMP模式,则无需切换。
    3. 执行ipmcset -d npuworkmode -v 0命令设置NPU芯片的工作模式为AMP模式。

    查询和设置NPU芯片工作模式的详细介绍请参见Atlas 800 训练服务器 iBMC用户指南(型号 9000)中的“命令行介绍 > 服务器命令 > 查询和设置NPU芯片工作模式(npuworkmode)”章节。

  • 一个vNPU只能被一个任务容器使用,不支持多个任务容器使用同一个vNPU。
搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词