任务容器未成功挂载NPU
2023/06/13
194
问题信息
问题来源 | 产品大类 | 产品子类 | 关键字 |
---|---|---|---|
官方 | 安装部署 | MindX DL | 未挂载NPU |
问题现象描述
在任务容器中,执行如下命令,系统无回显信息。此时表明容器内没有挂载上NPU设备。
ls /dev/davinci*
原因分析
Ascend Device Plugin的启动参数“useAscendDocker”默认为true,该参数表示Ascend Device Plugin需要配合Ascend Docker Runtime一起使用。若存在以下场景,可能导致Ascend Device Plugin配合Ascend Docker Runtime使用失败。
- 环境未安装Ascend Docker Runtime。
- 已安装Ascend Docker Runtime,但是未重启Docker服务。
解决措施
- 原因一:
请参考《MindX DL 集群调度用户指南》中“安装集群调度组件 > 常用操作 > 安装Ascend Docker Runtime”章节,安装Ascend Docker Runtime工具,然后重启Docker服务,删除旧任务,再重新下发任务。
- 原因二:
重启Docker服务,删除旧任务,再重新下发任务。
Ascend Docker Runtime能够主动将指定的NPU挂载到容器内,可通过如下命令查询Docker的配置。
docker info 2>&1 | grep "Default Runtime"
回显信息中有“ascend”表示Docker使用了Ascend Docker Runtime,示例如下。
Default Runtime: ascend
本页内容