export_param

功能说明

用于将Conv2dQuantizer, LinearQuantizer的输入和权重的量化参数保存为npy文件，该量化参数用于后续推理。包括量化输入尺度 (input scale)、量化输入偏移量(input offset)、量化权重尺度(weight_scale)、量化权重偏移量(weight_offset) 以及量化权重 (quant weight)。

函数原型

export_param(save_path)

参数说明

参数名	输入/返回值	含义	使用限制
save_path	返回值	量化参数的保存路径。	必选。数据类型：string。

参数名

输入/返回值

含义

使用限制

save_path

返回值

量化参数的保存路径。

必选。

数据类型：string。

调用示例

from msmodelslim.pytorch.quant.ptq_tools import QuantConfig, Calibrator
disable_names = []
input_shape = [1, 3, 224, 224]
quant_config = QuantConfig(disable_names=disable_names, amp_num=0, input_shape=input_shape)
calibrator = Calibrator(model, quant_config)
calibrator.run()
calibrator.export_param ("./output")

父主题： 训练后量化（PyTorch）