文档
注册

安装NPU驱动固件

安装说明

  • 首次安装场景:硬件设备刚出厂时未安装驱动,或者硬件设备前期安装过驱动固件但是当前已卸载,上述场景属于首次安装场景,需按照“驱动 > 固件”的顺序安装驱动固件。
  • 覆盖安装场景:硬件设备前期安装过驱动固件且未卸载,当前要再次安装驱动固件,此场景属于覆盖安装场景,需按照“固件 > 驱动”的顺序安装固件驱动。

检查安装环境

在安装驱动固件前,建议按照以下检查项检查环境,确保驱动固件能正常安装。

表1 环境检查

检查项

检查方法

检测NPU芯片是否正常在位

可通过命令行或BMC管理页面检查NPU芯片是否正常在位,如果执行命令时,提示没有安装lspci,可通过BMC管理页面检查。

  • 执行lspci | grep d802命令,如果服务器上有NN>0)路NPU芯片,回显中含“d802”字段的行数为N,则表示NPU芯片正常在位。
    01:00.0 Processing accelerators: Huawei Technologies Co., Ltd. Device d802 (rev 20)
    02:00.0 Processing accelerators: Huawei Technologies Co., Ltd. Device d802 (rev 20)
    41:00.0 Processing accelerators: Huawei Technologies Co., Ltd. Device d802 (rev 20)
    42:00.0 Processing accelerators: Huawei Technologies Co., Ltd. Device d802 (rev 20)
  • 通过iBMC查询NPU芯片名称方法:登录iBMC Web管理网站,选择“系统管理 > 系统信息”,单击“处理器”,查看NPU型号信息。

确认操作系统和内核版本

在安装驱动前,需要用户确认现场操作系统和内核版本,从而确定是否需要安装驱动编译所需依赖。

执行如下命令查看现场服务器操作系统和内核版本,并和华为的版本要求进行对比。
uname -m && cat /etc/*release
uname -r

操作系统内核版本和对应的安装方式如表2所示。

表2 Atlas 900 A2 PoDc 集群基础单元

host操作系统版本

host操作系统架构

软件包默认的host操作系统内核版本

gcc编译器版本

安装方式

Kylin V10 SP3

aarch64

4.19.90-52.22.v2207.ky10.aarch64

7.3.0

源码编译安装。

  1. 需要先参见安装驱动源码编译所需依赖安装dkms等依赖。
  2. 再按照安装驱动固件内容安装驱动固件。

CUlinux 3.0

aarch64

5.10.0-60.67.0.104.ule3.aarch64

10.3.1

CTyunOS 22.06

aarch64

4.19.90-2102.2.0.0066.ctl2.aarch64

7.3.0

BC-Linux 21.10

aarch64

4.19.90

7.3.0

UOS V20(1050u2e)

aarch64

4.19.90-2211.5.0.0178.22.uel20.aarch64

7.3.0

源码编译安装。使用内核进行驱动编译。

执行ls /lib/modules/`uname -r`/build命令,查看路径是否存在,若存在,直接按照安装NPU驱动固件内容安装驱动固件。安装驱动包时则会自动使用内核进行驱动编译。

安装驱动固件

  1. root用户登录服务器。
  2. 创建驱动运行用户HwHiAiUser(运行驱动进程的用户),安装驱动时无需指定运行用户,默认即为HwHiAiUser。
    groupadd HwHiAiUser
    useradd -g HwHiAiUser -d /home/HwHiAiUser -m HwHiAiUser -s /bin/bash
  3. 将驱动包和固件包上传到服务器任意目录如“/home”
  4. 执行如下命令,增加驱动和固件包的可执行权限。
    chmod +x Ascend-hdk-xxx-npu-driver_24.1.rc1_linux-aarch64.run
    chmod +x Ascend-hdk-xxx-npu-firmware_7.7.1.0.620.run
  5. 执行以下命令,完成驱动固件安装,软件包默认安装路径为“/usr/local/Ascend”
    • 安装驱动

      执行以下命令,完成驱动安装。

      ./Ascend-hdk-xxx-npu-driver_24.1.rc1_linux-aarch64.run --full --install-for-all
      • 若执行上述安装命令出现类似如下回显信息,请参见驱动安装缺少依赖报错解决。
        [ERROR]The list of missing tools: lspci,ifconfig,
      • 若执行上述安装命令出现类似如下回显信息,请参见驱动安装过程中出现dkms编译失败报错解决。
        [ERROR]Dkms install failed, details in : var/log/ascend_seclog/ascend_install.log. 
        [ERROR]Driver_ko_install failed, details in : /var/log/ascend_seclog/ascend_install.log.
      • 若系统出现如下关键回显信息,则表示驱动安装成功。
        Driver package installed successfully!
    • 安装固件
      执行以下命令,完成固件安装。
      ./Ascend-hdk-xxx-npu-firmware_7.1.0.6.220.run --full

      若系统出现如下关键回显信息,表示固件安装成功。

      Firmware package installed successfully! Reboot now or after driver installation for the installation/upgrade to take effect 
  6. 执行reboot命令重启系统。
  7. 执行npu-smi info查看驱动加载是否成功。

    若出现类似如下图所示回显信息,说明加载成功。否则,说明加载失败。请联系华为技术支持处理。

搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词