下载
中文
注册
Kubernetes 1.25.10及以上版本,不支持虚拟化的vNPU的恢复使能功能

Kubernetes 1.25.10及以上版本,不支持虚拟化的vNPU的恢复使能功能

2025/01/26

20

暂无评分
我要评分

问题信息

问题来源产品大类产品子类关键字
官方安装部署MindCluster集群调度Kubernetes、虚拟化

问题现象描述

Kubernetes1.25.10及以上版本,集群调度组件不支持虚拟化的vNPU的恢复使能功能。该功能的详细说明和操作指导请参见《Atlas 中心推理卡 24.1.RC3 npu-smi 命令参考》中的“算力切分相关命令 > 设置vNPU的配置恢复使能状态”章节。

原因分析

Kubernetes1.25.10以下版本在服务器重启后,任务Pod拉起的过程中仅判断资源类型是否存在,不判断该资源类型其值是否为空。Kubernetes 1.25.10及以上版本则会判断该资源类型其值是否为空,如果任务Pod先于设备插件的管理Pod启动,因为无可用资源,必定导致重调度。

解决措施

Kubernetes社区存在issue但该问题未被解决。用户如果能够修改源码解决该问题,可以手动处理;若无法修改源码,请避免使用此版本。

本页内容