BatchMatMulDequantElemwiseFusionPass
融合模式
量化场景,将BatchMatMul/MatMul +Dequant + Elemwise融合为BatchMatMul算子,Elemwise算子broadcast到MatMul上。
使用约束
- 仅支持将Elemwise算子broadcast到MatMul的shape上,broadcast轴仅支持batch轴上。
- Elemwise算子仅支持Add和Sub算子。
支持的型号
Atlas 200/500 A2推理产品
父主题: 图融合规则说明