安装驱动
本章节介绍宿主机上的安装方法,以Ascend-hdk-310b-npu-driver_x.x.x_linux-{arch}.run包为例说明,具体操作以客户实际Host系统对应驱动包为准。
注意事项
在软件包安装或升级过程中,不允许对Host或Device进行复位或下电操作,否则会出现Device无法正常启动或者升级失败。
操作步骤
- 首次安装请按照“驱动->固件”的顺序;覆盖安装或升级请按照“固件->驱动”的顺序,分别安装软件包。固件安装请参见安装固件。
- 首次安装过程中如果使用了--install-for-all参数,覆盖安装中也需要保留--install-for-all参数。
- 将获取软件包和配套表准备的安装包上传至Linux系统任意目录下(如“/opt”)。
- 使用PuTTY登录服务器的OS命令行。
- 执行如下命令,切换至root用户。
su - root
- 执行如下命令,进入软件包所在路径(如“/opt”)。
cd /opt
- 执行如下命令,增加软件包的可执行权限。
chmod +x Ascend-hdk-310b-npu-driver_x.x.x_linux-{arch}.run
- 执行如下命令,校验run安装包的一致性和完整性。
./Ascend-hdk-310b-npu-driver_x.x.x_linux-{arch}.run --check
若出现如下回显信息,表示软件包校验成功。Verifying archive integrity... 100% SHA256 checksums are OK. All good.
软件包校验使用SHA256加密方式;校验过程中若提示:./Ascend-hdk-310b-npu-driver_x.x.x_linux-{arch}.run does not contain an embedded MD5 checksum.和./Ascend-hdk-310b-npu-driver_x.x.x_linux-{arch}.run does not contain a CRC checksum,表示没有使用MD5和CRC加密方式,可忽略。
- 执行如下命令,完成驱动安装,软件包默认安装路径为“/usr/local/Ascend”。./Ascend-hdk-310b-npu-driver_x.x.x_linux-{arch}.run --full
- 安装详细日志路径:/var/log/ascend_seclog/ascend_install.log。
- 安装后软件包的安装路径、安装命令以及运行用户信息记录路径为“/etc/ascend_install.info”。
- 安装run包驱动时,会将动态库libdcmi.so和头文件dcmi_interface_api.h拷贝到“/usr/local/dcmi/”目录下。
- 若创建运行用户是非HwHiAiUser,安装驱动软件包时需要指定运行用户(通过--install-username=username --install-usergroup=usergroup参数指定)。
- 如果指定root用户为运行用户,则需要与--install-for-all参数配合使用,如下所示,该场景下权限控制可能存在安全风险。--install-username=root --install-usergroup=root --install-for-all
--install-username=root --install-usergroup=root --install-for-all
- 如果服务器无BMC时,只能采用默认路径安装驱动。如果采用指定路径安装,ipmi_si驱动加载时会出现阻塞,导致磁盘挂载慢,影响npu正常运行。
若用户需要指定安装路径,如以“/test/HiAI/”为例。可执行如下命令,完成安装。
./Ascend-hdk-310b-npu-driver_x.x.x_linux-{arch}.run --full --install-path=/test/HiAI/若系统出现如下关键回显信息,则表示驱动安装成功。Driver package installed successfully!
- (可选)安装时若出现以下回显,说明未安装dkms,默认内核源码路径如“/lib/modules/`uname -r`/build”不存在。请根据系统提示输入相应内容:
[WARNING]rebuild ko has something wrong, detail in /var/log/ascend_seclog/ascend_rebuild.log Do you want to try build driver after input kernel absolute path? [y/n]:
若需要继续安装,请输入y。
出现如下回显后,请根据提示输入您提供的内核源码的实际路径,如:/lib/modules/`uname -r`/build-bak。
Please input your kernel absolute path:
按“Enter”键继续安装。
- 若已安装dkms及相应kernel-header、kernel-devel等组件,则会自动执行dkms驱动编译安装。
- 若未安装dkms,但默认内核源码路径如“/lib/modules/`uname -r`/build”已存在,则会自动使用该内核进行驱动编译。
- 若使用dkms安装,在日志中出现类似打印“rmdir: failed to remove 'updates': Directory not empty”,可忽略,不影响实际安装。
若系统出现如下关键回显信息,则表示驱动安装成功。Driver package installed successfully!
- (可选)根据系统提示信息决定是否重启系统,若需要重启,请执行以下命令;否则,请跳过此步骤。
reboot
- 执行如下命令,查看驱动加载是否成功。
npu-smi info
若出现如下回显信息,说明加载成功,具体版本号和Device个数请以实际情况为准。否则,说明加载失败。请联系华为技术支持处理。
+--------------------------------------------------------------------------------------------------------+ | npu-smi 23.0.rc3 Version: 23.0.rc3 | +-------------------------------+-----------------+------------------------------------------------------+ | NPU Name | Health | Power(W) Temp(C) Hugepages-Usage(page) | | Chip Device | Bus-Id | AICore(%) Memory-Usage(MB) | +===============================+=================+======================================================+ | 0 310B | OK | 0.0 0 0 / 0 | | 0 0 | NA | 0 0 / 0 | +===============================+=================+======================================================+
- 加载失败,可以执行dmesg命令查看linux启动日志。如果出现 “/安装路径/driver/device/davinci_mini.fd copy err”信息,请参考卸载驱动章节卸载驱动,并使用默认路径重新进行驱动安装。
- 回显中“npu-smi”后面的字段为npu-smi工具版本号;“Version:”后面的字段为驱动版本号。