QuantConfig

功能说明

量化参数配置类，保存量化过程中配置的参数。

函数原型

QuantConfig(w_bit=8, a_bit=8, w_signed=True, a_signed=False, w_sym=True, a_sym=False, input_shape=None, act_quant=True, act_method=0, quant_mode=0, disable_names=None, amp_num=0, keep_acc=None, sigma=25)

参数说明

参数名	输入/返回值	含义	使用限制
w_bit	输入	权重量化bit。	可选。数据类型：int。默认为8，暂不支持其他bit量化，不支持修改。
a_bit	输入	激活层量化bit。	可选。数据类型：int。默认为8，暂不支持其他bit量化，不支持修改。
w_signed	输入	是否对权重进行符号量化。	可选。数据类型：bool。默认为True。
a_signed	输入	是否对激活值进行符号量化。	可选。数据类型：bool。默认为False。使用relu的CV模型建议设置为False，其他模型建议设置为True。
w_sym	输入	权重是否对称量化。	可选。数据类型：bool。默认为True。
a_sym	输入	激活值是否对称量化。	可选。数据类型：bool。默认为False。
input_shape	输入	模型输入的shape，用于Data-Free量化构造虚拟数据。当前仅支持单个输入，且输入数据格式为float的模型。针对多个输入或者需要自定义输入格式的模型，如需使用Data-Free量化，用户可自定义构造虚拟输入数据，可以通过配置calib_data参数实现多个输入，无需指定input_shape。	可选。数据类型：list[int]。默认值为[]。
act_quant	输入	是否对激活值进行量化。	可选。数据类型：bool。默认值为True。暂不支持修改。
act_method	输入	激活值量化方法。	可选。数据类型：int。取值为[0,1,2]，默认为0。 0代表Data-Free量化方法（具体由sigma参数决定）。 1代表Label-Free场景的min-max observer方法。Label-Free场景推荐选1。 2代表Label-Free场景的histogram observer方法。
quant_mode	输入	量化模式。	可选。数据类型：int。取值为[0,1]，默认为0。 0代表Data-Free量化模式。 1代表Label-Free量化模式。
disable_names	输入	需排除量化的节点名称，即手动回退的量化层名称。如精度太差，推荐回退量化敏感层，如分类层、输入层、检测head层等。	可选。数据类型：list[str]。默认值[]。
amp_num	输入	混合精度量化回退层数。精度降低过多时，可增加回退层数，推荐优先回退3~7层，如果精度恢复不明显，再增加回退层数。	可选。数据类型：int。默认为0。
keep_acc	输入	精度保持策略。 admm和round_opt是用来改善权重量化，减少权重量化误差，推荐在label-free模式下使用，适当改善量化效果。 easy_quant用来改善激活量化，减少激活量化误差，推荐在data-free模式下使用，通常能够起到较好的改善效果。	可选。数据类型：dict。包含以下三种精度保持策略： admm策略：数据类型[bool, int]，bool配置是否开启，int配置优化迭代次数。 easy_quant：数据类型[bool, int]，bool配置是否开启，int配置优化迭代次数。 round_opt：数据类型[bool]，bool配置是否开启。输入模板为：keep_acc={'admm': [False, 1000], 'easy_quant': [False, 1000], 'round_opt': False} 。
sigma	输入	Data-free的量化统计方法。建议输入值为0或25，卷积类模型使用sigma统计效果更好，transformers类模型min-max统计效果更好。	可选。数据类型：int。默认为25。 sigma=25时，使用sigma统计方法。 sigma=0时，使用min-max统计方法。

调用示例

from modelslim.pytorch.quant.ptq_tools import QuantConfig
disable_names = []
input_shape = [1, 3, 224, 224]
keep_acc={'admm': [False, 1000], 'easy_quant': [False, 1000], 'round_opt': False}
quant_config = QuantConfig(disable_names=disable_names, amp_num=0, input_shape=input_shape, keep_acc=keep_acc)

父主题： 训练后量化（PyTorch）