适用场景
- 业务场景:DVPP,昇腾模型算法,模型转化,精度调优、应用/算子开发,性能调优、TensorFlow训练
- 适用处理器:Atlas 200/300/500 推理产品、Atlas 推理系列产品、Atlas 训练系列产品
- 处理器形态:EP、RC
现象描述
通过BMC(Baseboard Management Controller)查询昇腾AI处理器相关状态,如温度、功耗等,查询失败,Device侧日志提示如图1所示。
图1 查询Atlas 200/300/500 推理产品状态失败
可能原因
- 昇腾AI处理器内部查询失败,导致无法给MCU返回正确结果。
- BMC的I2C通信线路异常,此时所有向昇腾AI处理器查询的命令都返回失败。
处理步骤
针对上述可能原因,可以参考以下方法处理:
- 查看返回信息,根据返回的错误码确认原因并处理,返回值列表表1所示。
表1 异常返回码
错误码 |
错误码含义 |
原因 |
1 |
获取数据超时。 |
设备侧出现异常,无法正常响应数据。 |
2 |
没有找到对应CMD的响应数据。 |
该查询CMD不支持。 |
3 |
该CMD的数据不可用。 |
该查询CMD数据不可用。 |
4 |
请求数据和相应数据长度不一致。 |
请求数据长度不对。 |
5 |
其他错误。 |
请求数据异常或者Device异常。 |
- 如果所有查询命令都返回失败,则判断为通信线路异常,需联系技术支持处理。