文档
注册

应用场景及方案

应用场景

昇腾虚拟化实例功能适用于多用户多任务并行,且每个任务算力需求较小的场景。对算力需求较大的大模型任务,不支持使用昇腾虚拟化实例。

虚拟化场景

昇腾虚拟化实例功能在物理机或虚拟机使用时,支持以下虚拟化场景,如表1所示。本文主要介绍在昇腾设备划分vNPU支持的场景和方法,如果涉及虚拟机相关的配置,需要结合另一本文档Atlas硬件产品 虚拟机配置指南一起使用。

表1 使用场景

昇腾虚拟化实例功能支持场景

支持昇腾硬件

操作流程

在物理机划分vNPU,挂载vNPU到虚拟机

Atlas 推理系列产品(配置Ascend 310P AI处理器)

  • Atlas 300I Pro 推理卡
  • Atlas 300V 视频解析卡
  • Atlas 300V Pro 视频解析卡
Atlas 训练系列产品
  • Atlas 800 训练服务器(型号 9000)
  • Atlas 800 训练服务器(型号 9010)

在物理机划分vNPU和挂载vNPU到虚拟机的步骤请参见Atlas硬件产品 虚拟机配置指南中的“安装虚拟机 > 配置NPU直通虚拟机 > vNPU直通虚拟机”。

在物理机划分vNPU,挂载vNPU到容器

  • 所有Atlas 推理系列产品(配置Ascend 310P AI处理器)
  • 所有Atlas 训练系列产品
  1. 在物理机划分vNPU的步骤请参见创建vNPU
  2. 挂载vNPU到容器的步骤请参见挂载vNPU

在物理机划分vNPU,挂载vNPU到虚拟机,在虚拟机内将vNPU挂载到容器

Atlas 推理系列产品(配置Ascend 310P AI处理器)
  • Atlas 300I Pro 推理卡
  • Atlas 300V 视频解析卡
  • Atlas 300V Pro 视频解析卡
  1. 在物理机划分vNPU和挂载vNPU到虚拟机的步骤请参见Atlas硬件产品 虚拟机配置指南中的“安装虚拟机 > 配置NPU直通虚拟机 > vNPU直通虚拟机”。
  2. 在虚拟机内挂载vNPU到容器的步骤请参见挂载vNPU

在物理机直通NPU到虚拟机,在虚拟机内划分vNPU,再将vNPU挂载到虚拟机内的容器

Atlas 推理系列产品(配置Ascend 310P AI处理器)

  • Atlas 300I Pro 推理卡
  • Atlas 300V 视频解析卡
  • Atlas 300V Pro 视频解析卡
  1. 在物理机直通NPU到虚拟机的步骤请参见Atlas硬件产品 虚拟机配置指南中的“安装虚拟机 > 配置NPU直通虚拟机 > NPU直通虚拟机”。
  2. 在虚拟机内划分vNPU步骤请参见创建vNPU
  3. 将vNPU挂载到虚拟机内的容器的步骤请参见挂载vNPU

vNPU挂载到容器方案

将vNPU挂载到容器有以下方案:

  • 原生Docker:结合原生Docker使用。通过npu-smi工具创建多个vNPU,通过Docker拉起运行容器时将vNPU挂载到容器。
  • Ascend Docker Runtime:结合Ascend Docker Runtime(容器引擎插件)使用。通过npu-smi工具创建多个vNPU,通过Ascend Docker拉起运行容器时将vNPU挂载到容器。
  • 集群调度组件:结合MindX DL中的集群调度组件Ascend Device PluginVolcano使用,支持静态虚拟化和动态虚拟化两种使用方案。
    • 静态虚拟化方式下,通过npu-smi工具提前创建多个vNPU,当用户需要使用vNPU资源时,基于Ascend Device Plugin组件的设备发现、设备分配、设备健康状态上报功能,分配vNPU资源提供给上层用户使用,此方案下,集群调度组件Volcano组件为可选。
    • 动态虚拟化方式下,Ascend Device Plugin组件上报其所在机器的可用AICore数目。虚拟化任务上报后,Volcano经过计算将该任务调度到满足其要求的节点。该节点的Ascend Device Plugin在收到请求后自动切分出vNPU设备并挂载该任务,从而完成整个动态虚拟化过程。该过程不需要用户提前切分vNPU,在任务使用完成后又能自动回收,很好地支持用户算力需求不断变化的场景。
搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词