下载
中文
注册

DynamicQuantUpdateScatterFusionPass

融合模式

将满足如下Pattern的结构融合成DynamicQuantUpdateScatter算子。

使用约束

  • 必须是DyanmicQuant的两个输出,一个输出给一个Scatter算子,且两个Scatter共用一个indices输入,同时两个Scatter的input0来自于不同的节点,两个scatter的axis相同。
  • DynamicQuant的output0为int8数据类型,output1为fp32。
  • DynamicQuant的输入dtype必须为float16或者bfloat16,且input1如果存在。input1的shape必须是1维,且等于input0的最后一维。
  • DynamicQuant的输出都是作为Scatter的第三个update的输入。

支持的型号

Atlas A2训练系列产品/Atlas 800I A2推理产品