使用vNPU说明
在K8s场景,当用户需要使用vNPU资源时,可以通过结合集群调度组件Ascend Device Plugin的使用,使Kubernetes可以管理昇腾处理器资源。使用方式又按照是否需要提前切分好vNPU,划分为静态虚拟化和动态虚拟化两种,且两种模式不能混用,也不能和之前章节提到的Ascend Docker Runtime使用方式混合使用。昇腾虚拟化实例特性支持的产品型号情况如下表所示:
特性 |
需要的集群调度组件 |
Atlas 训练系列产品支持情况 |
Atlas 推理系列产品(配置Ascend 310P AI处理器)支持情况 |
---|---|---|---|
静态虚拟化 |
Ascend Device Plugin |
支持全部Atlas 训练系列产品 |
Atlas 300I Pro 推理卡 |
(可选)Volcano |
Atlas 300V Pro 视频解析卡 |
||
(可选)HCCL-Controller |
Atlas 300I Duo 推理卡 |
||
动态虚拟化 |
Ascend Device Plugin |
不支持 |
Atlas 300I Pro 推理卡 |
Volcano |
Atlas 300V 视频解析卡 |
||
Atlas 300V Pro 视频解析卡 |
Ascend Device Plugin组件的安装请参见《MindX DL Ascend Docker Runtime用户指南》中的“ 安装部署”章节安装Ascend Device Plugin。
在静态虚拟化场景下,组件的可选性说明如下。
- Volcano:用户若使用自己的调度组件,需要进行参数配置,请参见表2 Ascend Device Plugin启动参数;用户也可直接使用该组件进行任务调度。
- HCCL-Controller:在使用Atlas 训练系列产品时才需要选择该组件;使用Atlas 推理系列产品(配置Ascend 310P AI处理器)时可不选择。
父主题: MindX DL挂载vNPU