conv2d

功能说明

在给定5HD格式的Data和FracZ格式的Weight的情况下计算2-D卷积。

Data tensor 的shape是5HD，即（N, C1, H, W, C0）；

Weight Tensor 的shape是 FracZ，即 (C1*filter_h*filter_w, N1, N0, C0)。

接口可以支持bias。

res_tensor的shape为[N, N1, H_out*W_out, N0]。

函数原型

conv(data, weight, para_dict, optim_dict=None, dsl_flag=True)

参数说明

data：2d卷积的FeatureMap，tensor，5HD格式，目前支持float16类型
 Atlas 200/300/500 推理产品，支持的数据类型：float16

Atlas 训练系列产品，支持的数据类型：float16

Atlas 推理系列产品，支持的数据类型：float16

Atlas 200/500 A2推理产品，支持的数据类型，支持的数据类型：float16、float32、bfloat16

Atlas A2训练系列产品/Atlas 800I A2推理产品，支持的数据类型：float16、float32、bfloat16
weight：2d卷积的Weight，tensor，FracZ格式
 Atlas 200/300/500 推理产品，支持的数据类型：float16

Atlas 训练系列产品，支持的数据类型：float16

Atlas 推理系列产品，支持的数据类型：float16

Atlas 200/500 A2推理产品，支持的数据类型，支持的数据类型：float16、float32、bfloat16

Atlas A2训练系列产品/Atlas 800I A2推理产品，支持的数据类型：float16、float32、bfloat16
para_dict：字典格式，包含各种参数，后续参数扩展一般都在para_dict
其中目前在para_dict里必须要传的参数：
- pad_h：int类型list，[pad_top, pad_bottom]，2d卷积在FeatureMap H方向的补边，如果不涉及pad值均设置为0。
- pad_w：int类型list，[pad_left, pad_right]，2d卷积在FeatureMap W方向的补边，如果不涉及pad值均设置为0。
- stride_h：int类型，2d卷积在FeatureMap H方向的移动步长。
- stride_w：int类型，2d卷积在FeatureMap W方向的移动步长。
- filter_h：int类型，2d卷积Filter H方向的大小。
- filter_w：int类型，2d卷积Filter W方向的大小。
其中目前在para_dict里支持的非必须参数：
- bias：tensor，目前支持float16类型，2d卷积的Bias。如果有该参数，则意味着卷积计算包含Bias，否则不包含Bias。并要求Bias是cout大小。
- offset_x：int类型，2d卷积在int8数据类型的FeatureMap中添加的负偏移量，用来确保输出在有效范围内。默认值为“0”。
- kernel_name：string 类型，2d卷积的kernel名称。默认值为“conv2d”。
- mad_dtype：string类型，2d卷积的输出数据类型，在weight类型为“int4” 或 “int8” 的情况下默认为“int32”，其他情况下默认为“float32”。
- dilate_h：int类型，2d卷积的 kernel 中每个数据点在H方向上的距离，取值范围是1~255。默认值为1，即每个数据点紧挨着上一个数据点。
- dilate_w：int类型，2d卷积的 kernel 中每个数据点在W方向上的距离，取值范围是1~255。默认值为1，即每个数据点紧挨着上一个数据点。
optim_dict：用户侧可控制优化特性的flag标志。
字典格式，字典内的key值是bool类型。
- True：表示对应特性开启
- False表示对应特性不开启
默认值是optim_dict = {"c0_optim_flg": False}，表示不开启C0=4的优化特性。

说明：当前仅支持c0_optim_flg的设置。
dsl_flag：是否支持UB自动融合，True：支持UB自动融合，False：不支持UB自动融合。

返回值

res_tensor：表示卷积计算的tensor，即卷积计算的结果输出。

约束说明

此接口暂不支持与其他TBE DSL计算接口混合使用。

支持的型号

Atlas 200/300/500 推理产品

Atlas 训练系列产品

Atlas 推理系列产品

Atlas 200/500 A2推理产品

Atlas A2训练系列产品/Atlas 800I A2推理产品

调用示例

对于Batch=1，C=32，H=16，W=8的FeatureMap、Cout=32，KernelH=KernelW=2的Weight的float16的2D卷积，

对应的5HD的FeatureMap tensor的shape为（Batch，C/16，H，W，16）=（1，2，16，8，16）

对应的FracZ的Weight tensor的shape为 (KernelH*KernelW*C/16, Cout/16, 16, 16)=（8，2，16，16）

对应的Bias tensor的shape为（Cout，）=（32，）

from tbe import tvm
from tbe import dsl

shape_in = (1, 2, 16, 8, 16)
shape_w = (8, 2, 16, 16)
pad_h = [1, 1]
pad_w = [1, 1]
stride_h = 1
stride_w = 1
dilate_h = 1
dilate_w = 1
filter_h = 2
filter_w = 2
Data = tvm.placeholder(shape_in, name='FmapW', dtype="float16")
Weight = tvm.placeholder(shape_w, name='FilterW', dtype="float16")
bias_tensor = tvm.placeholder((shape_w[1] * shape_w[2], ), name='Bias', dtype="float16")
res_tensor = dsl.conv(
    Data,
    Weight, 
    {"bias_tensor": bias_tensor,
     "pad_h": pad_h, "pad_w": pad_w,
     "stride_h": stride_h, "stride_w": stride_w,
     "dilate_h": dilate_h, "dilate_w": dilate_w,
     "filter_h": filter_h, "filter_w": filter_w,
     "offset_x":0})

父主题： NN计算接口