Atlas系列硬件: Atlas 200l DK A2 开发者套件; Atlas 200l DK 开发者套件（型号：3000）; 加速模块、加速卡、智能小站、服务器、集群

异构计算架构: CANN社区版; CANN商用版

AI框架: MindSpore; TensorFlow框架模型（社区版）; TensorFlow框架模型（商用版）; PyTorch框架适配

昇腾推理引擎: MindIE

应用使能MindX: MindX DL; MindX Edge; MindX SDK

全流程开发工具: MindStudio

应用场景及方案

适配的硬件型号

支持虚拟化实例功能的昇腾硬件设备如表1所示。

表1 硬件设备
设备类型	设备型号
训练设备（配置Ascend 910）	Atlas 900 PoD（型号 9000）
	Atlas 900T PoD Lite
	Atlas 800 训练服务器（型号9000）
	Atlas 800 训练服务器（型号9010）
	Atlas 300T 训练卡
	Atlas 300T Pro 训练卡
推理设备（配置昇腾310P AI处理器）	Atlas 300I Pro 推理卡
	Atlas 300I Duo 推理卡
	Atlas 300V 视频解析卡
	Atlas 300V Pro 视频解析卡

应用场景

昇腾虚拟化实例功能适用于多用户多任务并行，且每个任务算力需求较小的场景。

虚拟化场景

昇腾虚拟化实例功能在物理机或虚拟机使用时，支持以下虚拟化场景，如表2所示。本文主要介绍在昇腾设备划分vNPU支持的场景和方法，如果涉及虚拟机相关的配置，需要结合另一本文档《虚拟机配置指南》一起使用。

表2 使用场景
昇腾虚拟化实例功能支持场景	支持昇腾硬件	操作流程
在物理机划分vNPU，挂载vNPU到虚拟机	推理设备： Atlas 300I Pro 推理卡 Atlas 300V 视频解析卡 Atlas 300V Pro 视频解析卡训练设备： Atlas 800 训练服务器（型号9000 Atlas 800 训练服务器（型号9010）	在物理机划分vNPU和挂载vNPU到虚拟机的步骤请参见《vNPU直通虚拟机》。
在物理机划分vNPU，挂载vNPU到容器	所有推理设备（配置昇腾310P AI处理器）、所有训练设备（配置Ascend 910 处理器）	在物理机划分vNPU的步骤请参见创建vNPU。挂载到vNPU到容器的步骤请参见挂载vNPU。
在物理机划分vNPU，挂载vNPU到虚拟机，在虚拟机内将vNPU挂载到容器	推理设备（配置昇腾310P AI处理器） Atlas 300I Pro 推理卡 Atlas 300V 视频解析卡 Atlas 300V Pro 视频解析卡	在物理机划分vNPU和挂载vNPU到虚拟机的步骤请参见《vNPU直通虚拟机》。在虚拟机内挂载挂载vNPU到容器的步骤请参见挂载vNPU。
在物理机直通NPU到虚拟机，在虚拟机内划分vNPU，再将vNPU挂载到虚拟机内的容器	推理设备（配置昇腾310P AI处理器） Atlas 300I Pro 推理卡 Atlas 300V 视频解析卡 Atlas 300V Pro 视频解析卡	在物理机直通NPU到虚拟机的步骤请参见《NPU直通虚拟机》。在虚拟机内划分vNPU步骤请参见创建vNPU。将vNPU挂载到虚拟机内的容器的步骤请参见挂载vNPU。

vNPU挂载到容器方案

将vNPU挂载到容器有以下方案：

原生Docker：结合原生Docker使用。通过npu-smi工具创建多个vNPU，通过Docker拉起运行容器时将vNPU挂载到容器。
Ascend Docker Runtime：结合Ascend Docker Runtime（容器引擎插件）使用。通过npu-smi工具创建多个vNPU，通过Ascend Docker拉起运行容器时将vNPU挂载到容器。
集群调度组件：结合MindX DL中的集群调度组件Ascend Device Plugin、Volcano使用，支持静态虚拟化。静态虚拟化方式下，通过npu-smi工具提前创建多个vNPU，当用户需要使用vNPU资源时，基于Ascend Device Plugin组件的设备发现、设备分配、设备健康状态上报功能，分配vNPU资源提供给上层用户使用，此方案下，集群调度组件的Volcano组件为可选。