Ascend Device Plugin的配置
请根据Ascend Device Plugin的启动方式选择对应的修改方式
以二进制方式启动
- 打开Ascend Device Plugin服务的“device-plugin.service”配置文件
# 服务配置文件默认在该路径下 vim /etc/systemd/system/device-plugin.service
将参数volcanoType和autoStowing设置为true,修改如下所示加粗部分,其余部分已省略。
... [Service] ExecStart=/bin/bash -c "/usr/local/bin/device-plugin -volcanoType=true -autoStowing=true ..." ...
-volcanoType=true,重调度场景下必须使用volcano。
-autoStowing=true,是否开启自动纳管开关,默认为true;设置为false代表关闭自动纳管,当芯片健康状态由unhealthy变为healthy后,不会自动加入到可调度资源池中;关闭自动纳管,当芯片参数面网络故障恢复后,不会自动加入到可调度资源池中。该特性仅适用于昇腾910芯片。
- 重启Ascend Device Plugin服务
systemctl daemon-reload systemctl restart device-plugin.service
以容器方式启动
- 修改Ascend Device Plugin组件的启动yaml,修改如下所示加粗部分。
... containers: - image: ascend-k8sdeviceplugin:v3.0.RC3 name: device-plugin-01 resources: requests: memory: 500Mi cpu: 500m limits: memory: 500Mi cpu: 500m command: [ "/bin/bash", "-c", "--"] args: [ "device-plugin -useAscendDocker=true -volcanoType=true # 重调度场景下必须使用volcano -autoStowing=true # 是否开启自动纳管开关,默认为true;设置为false代表关闭自动纳管,当芯片健康状态由unhealth变为health后,不会自动加入到可调度资源池中;关闭自动纳管,当芯片参数面网络故障恢复后,不会自动加入到可调度资源池中。该特性仅适用于昇腾910芯片。 -listWatchPeriod=5 # 健康状态检查周期,范围[3,60];默认5秒 -logFile=/var/log/mindx-dl/devicePlugin/devicePlugin.log -logLevel=0" ] securityContext: privileged: true readOnlyRootFilesystem: true ...
- 在K8s管理点执行以下命令,启动Ascend Device Plugin。
kubectl apply -f device-plugin-xxx-*.yaml
父主题: MindX DL组件配置