aclnnIm2colBackward-NN算子接口-算子加速库-CANN商用版8.0.RC3开发文档-昇腾社区

[object Object][object Object]

Atlas 训练系列产品。
Atlas A2训练系列产品/Atlas 800I A2推理产品。

[object Object]

每个算子分为，必须先调用“aclnnIm2colBackwardGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器，再调用“aclnnIm2colBackward”接口执行计算。

[object Object]
[object Object]

[object Object]

算子功能：从批处理输入张量中提取滑动局部块，将滑动局部块数组合并为一个大张量。

考虑一个形状为 $(N,C,∗)$ 的批处理input张量，其中 $N$ 是批处理维度， $C$ 是通道维度，而 $∗$ 表示任意空间维度。

此操作将input空间维度内的每个滑动kernel_size大小的块展平为形状是 $(N,C×\prod(kernel_size),L)$ 的 3-D output张量的列(即最后一维)。

其中 $C×\prod(kernel_size)$ 是每个块内的值的数量（一个块有 $\prod(kernel_size)$ 个空间位置，每个空间位置都包含一个 $C$ 通道向量），而 $L$ 是这些块的总数：

$L=\prod_d⌊{\frac{spatial_size[d]+2×padding[d]−dilation[d]×(kernel_size[d]−1)−1}{stride[d]}+1}⌋$

其中spatial_size由input(上面的 $∗$ )的空间维度构成，而 $d$ 覆盖所有空间维度。因此，在最后一个维度（列维度）索引，output会给出某个块内的所有值。

[object Object]

参数说明：
- gradOutput(aclTensor*, 计算输入)：公式中的output张量，shape为 $(C×\prod(kernel_size),L)$ $(C \times \prod (k er n e l_{s} i ze), L)$ 或 $(N,C×\prod(kernel_size),L)$ $(N, C \times \prod (k er n e l_{s} i ze), L)$ 。Device侧的aclTensor，shape支持2维和3维。支持，支持ND。
  - Atlas 训练系列产品：数据类型支持FLOAT16、FLOAT。
  - Atlas A2训练系列产品/Atlas 800I A2推理产品：数据类型支持BFLOAT16、FLOAT16、FLOAT。
- inputSize(aclIntArray*, 计算输入): 公式中的参数 $spatial_size$ 。host侧的aclIntArray，输入张量的形状，size为2，数据类型为int64。
- kernelSize(aclIntArray*, 计算输入): 公式中的参数 $kernel_size$ 。host侧的aclIntArray，卷积核的大小，size为2，数据类型为int64。
- dilation(aclIntArray*, 计算输入): 公式中的参数 $dilation$ 。host侧的aclIntArray，膨胀参数，size为2，数据类型为int64。
- padding(aclIntArray*, 计算输入): 公式中的参数 $padding$ 。host侧的aclIntArray，卷积的填充大小，size为2，数据类型为int64。
- stride(aclIntArray*, 计算输入): 公式中的参数 $stride$ 。host侧的aclIntArray，卷积的步长，size为2，数据类型为int64。
- out(aclTensor*, 计算输出)：公式中的input张量，shape为 $(C,spatial_size[0],spatial_size[1])$ $(C, s p a t ia l_{s} i ze [0], s p a t ia l_{s} i ze [1])$ 或 $(N,C,spatial_size[0],spatial_size[1])$ $(N, C, s p a t ia l_{s} i ze [0], s p a t ia l_{s} i ze [1])$ 。Device侧的aclTensor，shape支持3维(gradOutput的shape是2维)和4维(gradOutput的shape是3维)。支持，支持ND。
  - Atlas 训练系列产品：数据类型支持FLOAT16、FLOAT。
  - Atlas A2训练系列产品/Atlas 800I A2推理产品：数据类型支持BFLOAT16、FLOAT16、FLOAT。
- workspaceSize(uint64_t*, 出参)：返回需要在Device侧申请的workspace大小。
- executor(aclOpExecutor**, 出参)：返回op执行器，包含了算子计算流程。
返回值：

aclnnStatus：返回状态码，具体参见。

[object Object]

[object Object]

参数说明：
- workspace(void*, 入参)：在Device侧申请的workspace内存地址。
- workspaceSize(uint64_t, 入参)：在Device侧申请的workspace大小，由第一段接口aclnnIm2colBackwardGetWorkspaceSize获取。
- executor(aclOpExecutor*, 入参)：op执行器，包含了算子计算流程。
- stream(aclrtStream, 入参)：指定执行任务的 AscendCL Stream流。
返回值：

aclnnStatus：返回状态码，具体参见。

[object Object]

无。

[object Object]

示例代码如下，仅供参考，具体编译和执行过程请参考。

[object Object]