pooling2d
功能说明
通过不同的池化方式,对tensor_in上不同的滑动窗口进行信号的采样。
池化方式支持MAX、AVG、GMP、GAP四种:
- MAX:max pooling 是取每个滑动窗口覆盖的元素的最大值作为计算输出。
- AVG:avg pooling是取每个滑动窗口覆盖的元素的和除以窗口面积取平均值后作为输出。
- GMP:global max pooling 是 max pooling 的特殊模式,即 window 的大小和 feature map 的大小一致的 max pooling
- GAP:global avg pooling 是 avg pooling 的特殊模式,即 window 的大小和 feature map 的大小一致的 avg pooling
如下图,tensor_in按照pooling_mode为MAX、padding_mode为SAME时池化结果。
其中:
- input_w:tensor_in的W。
- input_h:tensor_in的H。
- kernel_w:window的W
- kernel_h:window的H
- pad_top:tensor_in的H方向顶部的pad行数,图示中此值为1
- pad_bottom:tensor_in的H方向底部的pad行数,图示中此值为1
- pad_left:tensor_in的W方向上左边的pad列数,图示中此值为1
- pad_right:tensor_in的W方向行右边的pad列数,图示中此值为1
- stride_w:stride的W
- stride_h:stride的H
函数原型
pooling2d(tensor_in, window, stride, pooling_mode, padding_mode="SAME", pad = (0,0,0,0), dilation = (1,1), data_mode=1, ceil_mode=0, fusion_params=None, impl_mode="high_performance")
参数说明
- tensor_in:输入的feature map,tvm.tensor类型,支持的输入数据类型为float16。输入tensor_in需要符合5D-NC1HWC0格式排布,最后一维C0必须是16。
- window:输入的滑块大小信息,list、tuple类型。
window的维度必须为2,且为正整数,在[1, 32768]范围内。
window[0]表示输入window的width,window[1]输入window的height。
- stride:输入的滑块移动步长信息,list、tuple类型。
stride的维度必须为2且为正整数类型,stride的width、height需在[1, 63]范围内。
stride[0]表示window在feature map的W方向上移动的步长,stride[1]表示window在feature map的H方向上移动的步长。
- pooling_mode:pooling模式,支持“MAX”、“AVG"、“GMP”、“GAP”,分别表示max pooling, avg pooling, global max pooling, global avg pooling。
- MAX:max pooling 是取每个滑动窗口覆盖的元素的最大值作为计算输出。
- AVG:avg pooling是取每个滑动窗口覆盖的元素的和除以窗口面积取平均值后作为输出。
- GMP:global max pooling 为 max pooling 的特殊模式,feature map 大小和 window 大小一致,取 feature map 元素的最大值作为计算输出。
- GAP:global avg pooling 为 avg pooling 的特殊模式,feature map 大小和 window 大小一致,取 feature map 元素之和取均值后作为计算输出。
- padding_mode:padding模式,支持“VALID”、“SAME”,分别代表 不补pad、补pad。
- pad:补pad的数目,list、tuple类型。可选参数,用于兼容Caffe的pooling。
如果输入pad,那么pad的维度必须为4,pad值应 >= 0。
pad[0], pad[1], pad[2], pad[3] 分别代表用户输入的在top, bottom, left, right方向补的pad,默认值为(0,0,0,0)。
- dilation:膨胀系数,list、tuple类型,可选参数。
dilation的维度为2且为正整数类型,在[1, 255]范围内。
dilation[0]、dilation[1]分别表示window在H、W方向的膨胀系数,默认值为(1,1)。
- data_mode:模板使用类型,0: CAFFE_DATA_MODE, 1: TENSORFLOW_DATA_MODE。
- ceil_mode:Caffe模式下的round_mode 参数, 0:CEIL(default), 1:FLOOR。
- fusion_params:预留字段,开发者无需关注。
- impl_mode:算子运行时选择精度优先还是性能优先模式,有以下两种取值:
- high_precision:表示精度优先,精度优先时,由于计算过程复杂,性能会有所下降。
- high_performance:表示性能优先,性能优先时,精度会有所下降。
默认值“high_performance”。
返回值
res_tensor:输出tensor,tvm.tensor类型,为符合5D-NC1HWC0格式排布的tensor。
将tensor_in 的shape信息记为[N, C1, H, W, C0=16],window 的shape信息记为 [F, F],stride 信息记为 [S, S],则:
MAX and AVG 的VALID模式与SAME模式下输出tensor的shape信息计算方式分别如下所示:
- N 和C 维度保持不变。
- Hout = Wout = 1
约束说明
此接口暂不支持与其他TBE DSL计算接口混合使用。
- 当pooling_mode为MAX或AVG的VALID模式时需满足如下条件:
out_w * window_h * window_w * C0 * SIZE_OF_FP16 + out_w * C0 * SIZE_OF_FP16 < ub_size
- 当pooling_mode为AVG的SAME模式时需满足如下条件:
out_w * window_h * window_w * C0 * SIZE_OF_FP16 + out_w * C0 * SIZE_OF_FP16
+ out_w * C0 * SIZE_OF_FP16 < ub_size
- 当pooling_mode为AVG时,需满足 stride_h <= 2*window_h 且 stride_w <= 2*window_w。
- 当pooling_mode为AVG时,需满足 window的width*height < 256。
- 当pooling_mode为MAX时,需满足 window的width<=20 且 height <= 20
- 当pooling_mode为MAX或AVG时,tensor_in, pad, window 需满足:
stride_h <= in_size_h + pad_top + pad_bottom – window_h
stride_w <= in_size_w + pad_left + pad_right – window_w
- 当pooling_mode为GAP或GMP时,需满足 window_h = in_size_h 且 window_w = in_size_w。
- 当pooling_mode为GAP或GMP时,需满足 padding_mode = "VALID"。
- ub_size为UB可用大小。
- out_w为输出结果tensor的W。
- window_h为window的height。
- window_w为window的width。
- C0为tensor_in的C0。
- SIZE_OF_FP16为float16的大小。
支持的型号
Atlas 200/300/500 推理产品
Atlas 训练系列产品
Atlas 推理系列产品
Atlas 200/500 A2推理产品
Atlas A2训练系列产品/Atlas 800I A2推理产品
调用示例
from tbe import tvm from tbe import dsl shape = (1, 2, 416, 416, 16) input_dtype = "float16" data = tvm.placeholder(shape, name="data", dtype=input_dtype) res = dsl.pooling2d(data, (3, 3), (2, 2), "AVG", "SAME") # res.shape = (1, 2, 208, 208, 16)