AntiOutlierConfig
功能说明
构建用于异常值抑制的config。
函数原型
AntiOutlierConfig(w_bit=8, a_bit=8, anti_method="m1", dev_type="cpu")
参数说明
参数名 |
输入/返回值 |
含义 |
使用限制 |
---|---|---|---|
w_bit |
输入 |
权重量化bit。 |
可选。 数据类型:int。 默认为8,不支持修改。 |
a_bit |
输入 |
激活层量化bit。 |
可选。 数据类型:int。 默认为8,不支持修改。 |
anti_method |
输入 |
异常值抑制anti_outlier使用方法。 |
数据类型:string 可选值['m1', 'm2']。
|
dev_type |
输入 |
device类型。 |
可选。 数据类型:object。 默认为'cpu',不支持用户修改。 |
调用示例
from modelslim.pytorch.llm_ptq.anti_outlier import AntiOutlier, AntiOutlierConfig anti_config = AntiOutlierConfig(anti_method="m2") anti_outlier = AntiOutlier(model, calib_data=dataset_calib, cfg=anti_config, model_type='Llama') anti_outlier.process() calibrator = Calibrator(model, quant_config, calib_data=dataset_calib, disable_level='L0') calibrator.run(int_infer=False) calibrator.save(qaunt_weight_save_path)
父主题: 大模型量化接口