下载
中文
注册

容器化部署MindIE

本章节指导用户进行MindIE容器化部署,请确保服务器能够连接网络。

前提条件

  • 宿主机已经安装过驱动和固件,详情请参见安装驱动和固件
  • 用户在宿主机自行安装Docker(版本要求大于或等于24.x.x)。
  • 配置源之前,请确保安装环境能够连接网络。

操作步骤

  1. 拉取镜像。
    docker pull ubuntu:22.04

    此处拉取ubuntu 22.04仅为示例,用户可拉取其他支持的操作系统版本,但确保镜像拉取的操作系统符合支持的操作系统中的要求。

  2. 拉起容器,挂载宿主机目录。在容器部署过程中,用户无需在容器内安装驱动,只需根据不同产品类型将以下示例中的目录挂载至容器内,并在容器内安装MindIE的软件依赖,完成容器部署。

    可参考如下示例命令启动容器,具体挂载信息可根据产品路径和实际需求修改。

    docker run -it -d --net=host --shm-size=1g \
        --name <container-name> \
        --device=/dev/davinci_manager \
        --device=/dev/hisi_hdc \
        --device=/dev/devmm_svm \
        -v /usr/local/Ascend/driver:/usr/local/Ascend/driver:ro \
        -v /usr/local/sbin:/usr/local/sbin:ro \
        -v /path-to-weights:/path-to-weights:ro \
        ubuntu:22.04 bash
    1. 确认npu-smi工具是否成功挂载(默认路径为 “/usr/local/sbin/”,请根据实际情况调整路径)。
      使用命令查看该目录下的文件列表,确认npu-smi工具存在:
      ll /usr/local/sbin/
    2. 检查npu-smi的权限设置。
      确保npu-smi文件具有适当的执行权限。可以通过以下命令更改权限:
      chmod 555 /usr/local/sbin/npu-smi
    3. 验证执行权限。

      执行npu-smi info命令,检查是否有输出信息。如果没有输出信息,请再次检查上述步骤:

      npu-smi info
    表1 参数说明

    参数

    参数说明

    --shm-size=1g

    可能存在容器中共享内存不足的情况,启动容器时需要添加该参数以配置和host宿主机共享内存。

    --name

    容器名,请根据需要自行设定。

    --device

    表示映射的设备,可以挂载一个或者多个设备。

    需要挂载的设备如下:

    • /dev/davinci_manager:davinci相关的管理设备。
    • /dev/devmm_svm:内存管理相关设备。
    • /dev/hisi_hdc:hdc相关管理设备。
    说明:

    可根据以下命令查询device个数及名称方式,根据需要绑定设备,修改上面命令中的"--device=****"。

    ll /dev/ | grep davinci

    -v /usr/local/Ascend/driver:/usr/local/Ascend/driver:ro

    将宿主机目录“/usr/local/Ascend/driver ”挂载到容器,请根据驱动所在实际路径修改。

    -v /usr/local/sbin:/usr/local/sbin:ro

    挂载容器内需要使用的工具。

    -v /path-to-weights:/path-to-weights:ro

    挂载宿主机模型权重所在目录。

    挂载后请将/usr/local/Ascend/driver/下的so文件路径配置到LD_LIBRARY_PATH中,如下所示:

    export LD_LIBRARY_PATH=/usr/local/Ascend/driver/lib64/common:$LD_LIBRARY_PATH
    export LD_LIBRARY_PATH=/usr/local/Ascend/driver/lib64/driver:$LD_LIBRARY_PATH
  3. 进入容器。
    docker exec -it <container-name> /bin/bash
  4. 在容器内安装依赖,请参见安装依赖章节进行安装。
  5. 在容器内安装CANN的开发套件包、二进制算子包和加速库软件包,请参见安装CANN章节进行安装。

    在一个全新的容器内可能会出现apt源下载路径问题,请用户配置ubuntu22.04的专用源,提升下载速度。

    安装过程需要下载相关依赖,请确保安装环境能够连接网络。

    请在root用户下执行如下命令检查源是否可用。

    apt update

    如果命令执行报错或者后续安装依赖时等待时间过长甚至报错,则检查网络是否连接或者把“/etc/apt/sources.list”文件中的源更换为可用的源或使用镜像源(以配置华为镜像源为例,可参考华为开源镜像站)。

  6. 在容器内安装Python环境,请参见编译安装Python章节进行安装。
  7. 在容器内安装PyTorch,请参见《Ascend Extension for PyTorch 配置与安装》中的“安装PyTorch框架”章节进行安装。
  8. 在容器内安装ATB Models,请参见安装ATB Models章节进行安装。
  9. 安装MindIE软件包,请参见安装MindIE章节进行安装。

    安装完成后,即可在容器内进行MindIE的业务部署。