下载
中文
注册
设备上电后NPU无法上电或报错

设备上电后NPU无法上电或报错

2024/02/21

130

暂无评分
我要评分

问题信息

问题来源产品大类产品子类关键字
官方安装部署硬件(Atlas 800T A2 训练服务器)NPU无法上电

问题描述

设备上电后NPU无法上电或报错。

解决方案

  1. 确认OS已安装NPU驱动固件。

    • 是:执行2
    • 否:安装NPU驱动固件。

  2. 执行如下命令,查看是否有8个NPU。

    lspci | grep d802

    • 是:结束。
    • 否:执行34

    查询结果如图1所示。

    图1 查询NPU模组

  3. 重插该NPU模组J2和J3连接器对应CPU侧连接器线缆。具体连接器位置请参见NPU载板与CPU主板的连线
  4. 以上步骤无法解决问题,建议更换NPU模组,具体操作参见更换NPU模组

    1. 更换NPU模组前需联系现场服务人员协助保存相关OS日志,device日志,一键收集日志,plog日志。
    2. 更换NPU模组过程中,拆下NPU模组时注意避免与NPU载板器件撞件,拆下主板时注意避免与硬盘背板器件撞件。

本页内容