下载
中文
注册

MatmulReshapeTransposeFusionPass

融合模式

该融合将符合图融合pattern的Matmul算子前后的Transpose算子删除,同时交换Matmul算子的两路输入。

虚线框中的结构可以是一个或者多个。

使用约束

  • 算子dtype只支持FP32。
  • format只支持ND/NCHW/NHWC。
  • 所有Transpose算子输入必须是3维,且最后一维shape为1,其功能为交换shape前两维,不支持动态shape。
  • Matmul算子之前的Reshape算子,进行的操作是删除shape中最后一个1。Matmul算子之后的Reshape算子则是shape增加一个1的维度。
  • Matmul算子的属性transpose_x1/x2必须是false/false。
  • 第一个Reshape算子之后,至少有一路Matmul+Reshape+Transpose的结构。支持多路Matmul+Reshape+Transpose,要求每一路都满足上述结构,否则不融合。

支持的型号

Atlas 200/500 A2推理产品

Atlas A2训练系列产品/Atlas 800I A2推理产品