工具实现的融合功能
当前该工具主要实现的融合功能,分为如下几类(如下融合场景中涉及的单个算子,需要先满足量化场景的约束条件):
- AMCT在量化前会对模型中的"Conv2D+BatchNorm"结构做Conv+BN融合,融合后的"BatchNorm"层会被删除。
- Depthwise_Conv+BN融合:AMCT在量化前会对模型中的"DepthwiseConv2dNative+BatchNorm"结构做Depthwise_Conv+BN融合,融合后的"BatchNorm"层会被删除。
- OP+(BiasAdd)+Mul融合:AMCT在量化前会对模型中的“Conv2D/MatMul/DepthwiseConv2dNative/Conv2DBackpropInput+Mul”和“Conv2D/MatMul/DepthwiseConv2d/Conv2DBackpropInput+BiasAdd+Mul”结构做OP+(BiasAdd)+Mul融合,融合后的“Mul”层会被删除。
该场景下,要求Mul的另外一路输入为Const类型,且Shape为空。
- Group_conv+BN融合:如果模型中使用"Split+多路Conv2D+ ConcatV2(或Concat,且Concat在C轴)"表示Group_conv,AMCT在量化前会对模型中"Group_conv+BatchNorm"结构做融合,融合后的"BatchNorm"层会被删除。
BN支持融合的算子类型为FusedBatchNorm, FusedBatchNormV2 和FusedBatchNormV3。
- BN小算子融合为FusedBatchNormV3大算子:仅训练后量化支持,并且只有Conv+BN或者Conv+BiasAdd+BN结构才会触发BN小算子融合为大算子,且仅支持BN小算子输入为4维的场景。
AMCT对tf.keras.layers.BatchNormalization产生的小算子结构的BN进行匹配,并且将匹配到的小算子BN结构替换为大算子的BN结构,具体支持的小算子BN结构的场景如下所示:
- tf.keras.layers.BatchNormalization接口满足:入参fused=False,调用参数inputs, training=False,融合前后网络结构图为:
- tf.keras.layers.BatchNormalization接口满足:入参fused=False, center=False,调用参数inputs, training=False,融合前后网络结构图为:
- tf.keras.layers.BatchNormalization接口满足:入参fused=False, scale=False,调用参数inputs, training=False,融合前后网络结构图为:
- tf.keras.layers.BatchNormalization接口满足:入参fused=False, scale=False, center=False,调用参数inputs, training=False,融合前后网络结构图为:
- tf.keras.layers.BatchNormalization接口满足:入参fused=False,调用参数inputs, training=False,融合前后网络结构图为:
父主题: 附录