下载
中文
注册

TbeAippConvReluMaxpoolingFusion

融合模式

该融合将满足如下Pattern关系的子图中Aipp(可选) + Conv2D + Dequant(可选) + ElemWise(可选) + MaxPool(MaxPool/Pooling/MaxPoolv3)+ AscendQuant(可选)算子融合成1个融合算子。

使用约束

满足如下条件才可以融合:

  • Conv2D:small channel使能, kernel需为3*3,5*5或7*7,strides需为[1, 1]或[2, 2],cout ≤ 64。
  • MaxPool:strides = [2, 2], ksize = [2, 2]/[3, 3]。
  • 当MaxPool ksize = [2, 2]时,Conv2D input width超过1000不启用该融合。
  • 当MaxPool ksize = [3, 3]时,Conv2D input width超过800不启用该融合。
  • Pooling:strides = [2, 2], window= [2, 2]/[3, 3]。
  • 当Pooling window = [2, 2]时,Conv2D input width超过1000不启用该融合。
  • 当Pooling window = [3, 3]时,Conv2D input width超过800不启用该融合。

Maxpoolv3满足如下条件才可以融合:

  • soc:Atlas 推理系列加速卡产品
  • conv2d:

    (1)输入参数的format为NCHW

    (2)fmap的shape为[N,3,224,224],N为任意合法输入

    (3)filter的shape为[N,3,7,7],N为1~96

    (3)pads的shape为[3,3,3,3]

    (4)strides的shape为[N,N,2,2],N为任意合法输入

    (5)dilations的shape为[N,N,1,1],N为任意合法输入

    (6)groups为1

  • maxpoolv3:

    (1)输入参数的format为NCHW

    (2)strides的shape为[N,N,2,2],N为任意合法输入

    (3)ksize的shape为[N,N,3,3],N为任意合法输入

    (4)padding_mode为CALCULATED

    (5)pads的shape为[1,1,1,1]

    (6)global_pooling为false

    (7)ceil_mode为false

  • aipp:使能C04
  • elemwise:仅支持Relu和LeakyRelu

支持的型号

Atlas 200/300/500 推理产品

Atlas 推理系列产品

Atlas 200/500 A2推理产品

Atlas 训练系列产品