融合规则设计
融合规则设计包括明确融合方案、明确融合算子原型和明确融合对应关系。
明确融合方案
下面以多对一融合规则DecodeBboxV2ScopeFusionPass为例介绍如何设计和开发Scope融合规则。
该融合规则的目标是把Decode scope下的所有小算子融合为一个大算子DecodeBboxV2,Scope内包括2个Exp算子/4个Mul算子/4个Sub算子/2的倍数个RealDiv算子/2个Unpack算子/1个Pack算子/3个Transpose算子/不能包括Softmax算子,如图1所示。
明确融合算子原型
DecodeBboxV2融合算子原型为:
REG_OP(DecodeBboxV2) .INPUT(boxes, TensorType({DT_FLOAT16,DT_FLOAT})) .INPUT(anchors, TensorType({DT_FLOAT16,DT_FLOAT})) .OUTPUT(y, TensorType({DT_FLOAT16,DT_FLOAT})) .ATTR(scales, ListFloat, {1.0, 1.0, 1.0, 1.0}) .ATTR(decode_clip, Float, 0.0) .ATTR(reversed_box, Bool, false) .OP_END_FACTORY_REG(DecodeBboxV2)
算子原型API可以参考《基础数据结构和接口》中的"ge命名空间>原型定义接口(REG_OP)"章节。
明确融合对应关系
如图1所示,
- transpose的第0个输入作为DecodeBboxV2的第0个输入boxes;
- get_center_coordinates_and_sizes/transpose的第0个输入作为DecodeBboxV2的第1个输入anchors;
- transpose_1的输出作为DecodeBboxV2的输出y。
父主题: 融合规则开发