下载
中文
注册

export_quant_onnx

功能说明

量化参数配置类,通过calibrator类封装量化算法来保存量化后的onnx模型。

函数原型

export_quant_onnx(model_arch, save_path, input_names=None, fuse_add=True, save_fp=False)

参数说明

参数名

输入/返回值

含义

使用限制

model_arch

输入

模型结构名称。

必选。

数据类型:String。

save_path

输入

量化模型的存放路径。

必选。

数据类型:String。

input_names

输入

onnx的输入名称,有N个输入就要写N个名称。

可选。

数据类型:list[str] 。

默认情况下,onnx名称默认为input.1、input.2……到input.N的顺序,数字命名根据模型输入的个数进行递增。

fuse_add

输入

导出的量化模型是否融合量化bias。

可选。

数据类型:bool。

默认为True。

save_fp

输入

是否保留量化前onnx模型。

可选。

数据类型:bool。

默认为False。

调用示例

from modelslim.pytorch.quant.ptq_tools import QuantConfig, Calibrator
disable_names = []
input_shape = [1, 3, 224, 224]
quant_config = QuantConfig(disable_names=disable_names, amp_num=0, input_shape=input_shape)
calibrator = Calibrator(model, quant_config)
calibrator.run()
calibrator.export_quant_onnx("model", "./output", ["input.1"])