文档
注册

安装Ascend Deployer工具和准备软件包

在安装昇腾软件前,需要在训练服务器安装相关的系统依赖,用户可以根据现场训练服务器是否能够连接外部网络选择如下安装依赖方式。

  • 离线安装:现场服务器未连通外部网络的,需要在PC下载Ascend Deployer工具,并通过Ascend Deployer工具下载安装依赖。
  • 在线安装:在能连通外部网络的训练服务器上安装Ascend Deployer工具,并通过Ascend Deployer工具在线拉取安装依赖。

离线安装

  1. 下载软件获取的Ascend Deployer工具解压至本地文件夹,获得“ascend-deployer-6.0.RC1”目录。
  2. Windows环境需安装Python3,推荐使用Python3.7版本以上。如果已安装,请忽略。

    下载链接(仅为示例):Python3.7.5,请根据界面提示完成安装。

    1. 双击exe安装包,进入安装界面。
      勾选“Add Python3.7 to PATH”(添加Python环境变量),单击“Customize installation”(自定义安装),如图1所示。
      图1 Python安装界面
    2. 进入自定义安装界面,如图2所示,单击“Next”
      图2 自定义安装
    3. 进入高级选项界面,如图3所示。
      勾选“Add Python to environment variables”,并自定义安装路径,单击“Install”安装。
      图3 自定义安装路径
    4. 图4所示,安装成功后,单击“Disable path length limit”,禁用系统的Path长度限制,再单击“Close”关闭。
      图4 安装成功
    5. 查看Python是否安装成功。
      1. 进入Python安装路径。如图5所示。
        图5 Python安装路径
      2. 在安装路径输入“cmd”,单击回车键,打开命令提示符。如图6所示。
        图6 运行cmd
      3. 进入命令提示符,如图7所示,执行python -V命令,回显Python对应版本则表示安装成功。
        图7 查询Python版本
  3. 双击运行“ascend-deployer-6.0.RC1/ascend_deployer”目录下的“start_download_ui.bat”

    在弹出的简易UI界面,仅需勾选待安装设备的OS下载Docker软件和系统依赖,务必不要勾选界面右侧软件(PKG_LIST),单击“开始下载”,如图8所示。

    图8 下载Docker软件和系统依赖
    • 若出现类似如下回显,如图9所示,表示下载完成。
      图9 下载完成
    • 若出现类似如下报错信息,如图10所示。
      图10 下载失败

      请用户执行如下步骤更换pip源解决:

      1. 修改“ascend-deployer-6.0.RC1/ascend_deployer/downloader/config.ini”文件中pip源(如下加粗内容所示,将原来的pip源注释或删除,配置其他可用源)。
        [pypi]
        #index_url=https://repo.huaweicloud.com/repository/pypi/simple
        index_url=https://pypi.tuna.tsinghua.edu.cn/simple
        [proxy]
        verify=false
        
        [python]
        ascend_python_version=Python-3.7.5
        
        [download_config]
        parallel_download = 1

        https://pypi.tuna.tsinghua.edu.cn/simple:该pip源仅为示例,若该pip源失效请用户更换其他可用源。

      2. 文件修改完成后,请用户重新下载系统依赖。
  4. 下载软件下载的NPU驱动固件、Toolkit、kernels和tfplugin(使用TensorFlow框架训练模型时需安装该插件)软件包放置于“ascend-deployer-6.0.RC1/ascend_deployer/resources”目录。
    resources文件夹内容如下:
    resources 
    ├─ Ascend-hdk-xxx-npu-driver_24.1.rc1_linux-aarch64.run
    ├─ Ascend-hdk-xxx-npu-firmware_7.1.0.6.220.run
    ├─ Ascend-cann-toolkit_8.0.RC1_linux-aarch64.run
    ├─ Ascend-cann-kernels-xxx_8.0.RC1_linux.run
    ├─ Ascend-cann-tfplugin_8.0.RC1_linux-aarch64.run
    ├─ CTyunOS_22.06_aarch64
    ├─ nexus
    ├─ pylibs
    └─ sources

    因部署软件时会校验安装包,请用户在resources文件夹下不要添加其他的软件安装包。

  5. 放置深度学习框架软件包。
    用户可根据模型训练选择需要的深度学习框架进行安装,请参见表1
    表1 深度学习框架

    深度学习框架

    获取链接

    放置于指定目录

    TensorFlow 1.15.0

    TensorFlow1.15.0

    “ascend-deployer/resources/pylibs”目录。

    TensorFlow 2.6.5

    TensorFlow2.6.5

    MindSpore

    MindSpore

    “ascend-deployer/resources/pylibs/Ascend”目录,Ascend目录需用户自行创建。

    PyTorch

    torch包:torch

    torch_npu包:torch_npu

    apex:请参见安装APEX混合精度模块编译获取apex包。

    “ascend-deployer/resources/pylibs”目录。

  6. 然后将“ascend-deployer-6.0.RC1”整个目录压缩成zip包上传至服务器任意目录(以“/home”目录为例),执行unzip ascend-deployer-6.0.RC1.zip命令解压获得“ascend-deployer-6.0.RC1”目录。

在线安装

  1. root用户登录服务器,并确保该服务器能够连接外部网络(用于Ascend Deployer工具下载系统依赖)。
  2. 下载软件获取的Ascend Deployer工具上传至服务器任意目录(以“/home”目录为例),执行unzip ascend-deployer-6.0.RC1.zip命令解压获得“ascend-deployer-6.0.RC1”目录。
  3. 确保服务器已安装Python3(可执行python3 -V查询),如果没有,需执行如下命令安装Python3(以Ubuntu和CentOS为例)。
    yum install -y python3
  4. 进入“/home/ascend-deployer-6.0.RC1/ascend_deployer”目录,执行如下命令,下载Docker软件和系统依赖。
    bash start_download.sh --os-list=<OS> 

    <OS>可选范围可通过执行bash start_download.sh --help查看。参数说明具体请参考表2

    命令示例:
    bash start_download.sh --os-list=CentOS_7.6_aarch64
    表2 参数说明

    参数

    说明

    --os-list=<OS>

    --os-list参数用于指定待安装设备的OS,请根据实际替换,可同时指定多个。示例如下:

    --os-list=CTyunOS_22.06_aarch64

  5. 下载软件下载的NPU驱动固件、Toolkit、kernels和tfplugin(使用TensorFlow框架训练模型时需安装该插件)软件包上传至服务器“ascend-deployer-6.0.RC1/ascend_deployer/resources”目录。
    resources文件夹内容如下:
    resources 
    ├─ Ascend-hdk-xxx-npu-driver_24.1.rc1_linux-aarch64.run
    ├─ Ascend-hdk-xxx-npu-firmware_7.1.0.6.220.run
    ├─ Ascend-cann-toolkit_8.0.RC1_linux-aarch64.run
    ├─ Ascend-cann-kernels-xxx_8.0.RC1_linux.run
    ├─ Ascend-cann-tfplugin_8.0.RC1_linux-aarch64.run
    ├─ CTyunOS_22.06_aarch64
    ├─ nexus
    ├─ pylibs
    └─ sources

    因部署软件时会校验安装包,请用户在resources文件夹下不要添加其他的软件安装包。

  6. 放置深度学习框架软件包。
    用户可根据模型训练选择需要的深度学习框架进行安装,请参见表3
    表3 深度学习框架

    深度学习框架

    获取链接

    放置于指定目录

    TensorFlow 1.15.0

    TensorFlow1.15.0

    “ascend-deployer/resources/pylibs”目录。

    TensorFlow 2.6.5

    TensorFlow2.6.5

    MindSpore

    MindSpore

    “ascend-deployer/resources/pylibs/Ascend”目录,Ascend目录需用户自行创建。

    PyTorch

    torch包:torch

    torch_npu包:torch_npu

    apex:请参见安装APEX混合精度模块编译获取apex包。

    “ascend-deployer/resources/pylibs”目录。

搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词