工具部署架构

产品形态介绍

产品形态不同,AMCT部署架构不同,下面先介绍产品形态,然后分场景介绍不同产品形态下AMCT的部署架构。

以昇腾 AI 处理器的PCIe的工作模式进行区分,如果PCIe工作在主模式,可以扩展外设,则称为RC模式;如果PCIe工作在从模式,则称为EP模式。

两种模式的产品及架构如图1所示。

Host和Device的概念说明如下:

图1 RC和EP模式

Ascend EP产品形态部署架构

AMCT部署架构如图2所示,支持部署部署的操作系统请参见支持的OS清单。使用该工具量化完的模型,需要借助ATC工具转换成适配昇腾AI处理器的离线模型,然后完成推理操作。

图2 Ascend EP部署架构
  1. 用户需要先在满足要求的服务器部署AMCT,完成模型压缩操作。
  2. 用户将压缩后的模型,借助ATC工具转换成适配昇腾AI处理器的离线模型。
  3. 2中的.om离线模型,在安装昇腾AI处理器的服务器完成推理业务。

Ascend RC产品形态部署架构

AMCT部署架构如图3所示,当前仅支持在Ubuntu 20.04 aarch64或18.04 aarch64架构操作系统进行部署,配套信息请参见系统要求和环境检查。使用该工具量化完的模型,需要借助ATC工具转换成适配昇腾AI处理器的离线模型,然后完成推理操作。
图3 Ascend RC部署架构
  1. 用户需要先在Ubuntu aarch64架构服务器部署AMCT,完成模型压缩操作。
  2. 用户将压缩后的模型,借助ATC工具转换成适配昇腾AI处理器的离线模型。
  3. 2中的.om离线模型,在安装昇腾AI处理器的服务器完成推理业务。