MatMulAlignInputsFusionPass
融合模式
当matmul算子输入shape内轴非512B对齐时,MTE效率较低,性能表现较差。该图融合就是将matmul的输入shape进行对齐,解决性能问题。
使用约束
仅适用于静态场景,且输入DType为Float32,输入不带bias。
支持的型号
Atlas A2训练系列产品/Atlas 800I A2推理产品
父主题: 图融合规则说明
当matmul算子输入shape内轴非512B对齐时,MTE效率较低,性能表现较差。该图融合就是将matmul的输入shape进行对齐,解决性能问题。
仅适用于静态场景,且输入DType为Float32,输入不带bias。
Atlas A2训练系列产品/Atlas 800I A2推理产品