简介
ModelSlim
ModelSlim,即昇腾压缩加速工具,一个以加速为目标、压缩为技术、昇腾为根本的亲和压缩工具。昇腾AI模型开发用户可以灵活调用Python API接口,对模型进行性能调优,并支持导出不同格式模型,在昇腾AI处理器上运行。
训练后量化
PTQ(Post-Training Quantization)即训练后量化,训练后量化会量化预训练的浮点模型和使用部分训练数据来校准模型。包含Data-Free和Label-Free算法,这两种训练后量化算法可在昇腾推理平台进行,同时支持有/无校准数据集的PTQ量化场景,可将Float浮点模型转换为定点INT8模型,达到模型压缩、减少计算量、缩短推理时延的目的。
- Data-Free量化:无需获取输入数据集,即可对模型进行量化。通过翻转优化权重,多尺度渐进迭代优化的方法在无数据场景实现了有效量化。
- Label-Free量化:用户需要提供少量数据集做矫正,相比于无数据量化,Label-Free量化的输入数据符合原数据分布,量化精度会更高。
父主题: ModelSlim工具