具体运行流程如图1所示。
关键步骤 |
说明 |
---|---|
安装前准备 |
安装AMCT之前,需要创建AMCT的安装用户,检查系统环境是否满足要求,安装依赖以及上传软件包等一系列动作。详细操作请参见安装前准备。 |
安装 |
参见安装安装ONNX模型的AMCT。 |
安装后处理 |
由于AMCT存在基于ONNX Runtime的自定义算子包,而自定义算子编译时依赖ONNX Runtime提供的头文件,因此需要用户自行下载相关头文件后,编译并安装自定义算子包,相关方法请参见安装后处理(该步骤为必选操作,否则可能会导致AMCT无法使用)。 如果要设置量化过程中打印的日志等级信息,还需要设置环境变量等操作。 |
(可选)编写脚本,调用AMCTAPI |
如果用户需要量化自己的网络模型,不使用本手册提供的sample进行量化,则需要修改量化脚本,进行适配,然后才能进行量化。 |
量化 |
AMCT提供了两种量化方法,命令行方式量化和调用Python API接口方式,两种方式详细区别请参见快速入门。
用户根据准备的原始网络模型以及数据集,采用本手册提供的量化脚本或者命令行,进行量化。 |
自动量化 |
查看量化后的模型精度是否满足要求,如果不满足,则请参见基于精度的自动量化进行自动量化操作。 |
(后续处理)使用ATC工具进行模型转换 |
用户使用上述量化后的部署模型,通过ATC工具转换成昇腾AI处理器的离线模型,然后可以使用该模型进行推理。 |