组件启动yaml执行成功,找不到组件对应的Pod
2023/06/13
200
问题信息
问题来源 | 产品大类 | 产品子类 | 关键字 |
---|---|---|---|
官方 | 安装部署 | MindX DL | Pod、标签 |
问题现象描述
以Ascend Device Plugin为例,组件启动yaml执行成功,出现多个created。Ascend Device Plugin对应的K8s DaemonSet(ds)资源已经创建了,但是却找不到Pod。
原因分析
该节点可能缺少Ascend Device Plugin对应的标签,安装Ascend Device Plugin的节点必须要有“accelerator=huawei-Ascendxxx”标签,如:accelerator=huawei-Ascend910。
解决措施
执行如下命令,为节点打上标签。
kubectl label nodes 主机名称 accelerator=huawei-Ascend910
更多节点对应的标签信息请参见《MindX DL 集群调度用户指南》中“安装集群调度组件 > 常用操作 >创建节点标签”章节。
本页内容