概述
- 基本概念
昇腾模型压缩工具(Ascend Model Compression Toolkit,简称AMCT)是一个针对昇腾芯片亲和的深度学习模型压缩工具包,提供量化、张量分解等多种模型压缩特性,压缩后模型体积变小,部署到昇腾AI处理器上后可使能低比特运算,提高计算效率,达到性能提升的目标。
- 工具部署架构
本节介绍AMCT在不同产品形态下的部署架构。
- 工具运行流程
本节介绍AMCT工具各压缩特性的运行流程,从流程中可以看出压缩特性的使用顺序,用户如果想对同一个模型使用多个压缩特性,比如张量分解和量化,则应该先进行张量分解,后进行量化。