aclnnUpsampleBicubic2dAA-NN算子接口-算子加速库-CANN商用版8.0.RC3开发文档-昇腾社区

[object Object][object Object]

[object Object]

每个算子分为，必须先调用“aclnnUpsampleBicubic2dAAGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器，再调用“aclnnUpsampleBicubic2dAA”接口执行计算。
- [object Object]
- [object Object]

[object Object]

算子功能：对由多个输入通道组成的输入信号应用双三次抗锯齿算法进行上采样。如果输入tensor x的shape为(N, C, H, W) ，则输出tensor out的shape为(N, C, outputSize[0], outputSize[1])。
计算公式：对于一个二维插值点 $(N, C, h, w)$ ，插值 $out(N, C, h, w)$ 可以表示为：

{out(N, C, h, w)}=\sum_{i=0}^{kW}\sum_{j=0}^{kH}{W(i, j)}*{f(h_i, w_j)}

scaleH =\begin{cases} (x.dim(2)-1 / outputSize[0]-1) & alignCorners=true \\ 1 / scalesH & alignCorners=false\&scalesH>0\\ x.dim(2) / outputSize[0] & otherwise \end{cases}

scaleW =\begin{cases} (x.dim(3)-1 / outputSize[1]-1) & alignCorners=true \\ 1 / scalesW & alignCorners=false\&scalesW>0\\ x.dim(3) / outputSize[1] & otherwise \end{cases}

其中：

如果 $scaleH >= 1$ ，则 $kH = 1/scaleH$ ，否则 $kH = 4$
如果 $scaleW >= 1$ ，则 $kW = 1/scaleW$ ，否则 $kW = 4$
$h_i = |h| + i$
$w_j = |w| + j$
$f(h_i, w_j)$ 是原图像在 $(h_i, w_j)$ 的像素值
$W(i, j)$ 是双三次抗锯齿插值的权重，定义为： $W(d) =\begin{cases} (a+2)|d|^3-(a+3)|d|^2+1 & |d|\leq1 \\ a|d|^3-5a|d|^2+8a|d|-4a & 1<|d|<1 \\ 0 & otherwise \end{cases}$

其中：

[object Object]

参数说明：
- x（const aclTensor*，计算输入）：Device侧的aclTensor，数据类型支持FLOAT16、FLOAT、BFLOAT16。支持，支持NCHW，shape维度仅支持4维shape的tensor，数据类型与出参[object Object]的数据类型一致。
- outputSize（const aclIntArray*，计算输入）：Device侧的aclIntArray，指定输出空间大小，数据类型支持INT64，取值范围[max(1，x.dim()/64)，x.dim()*64]。
- alignCorners（bool，计算输入）：Host侧的BOOL型参数，指定是否对齐角像素点。如果为True，则输入和输出张量的角像素点会被对齐，否则不对齐，默认为False。
- scalesH（double，计算输入）：Host侧的DOUBLE型参数，指定空间大小的height维度乘数, 取值范围0或[1/64, 64]。
- scalesW（double, 计算输入）：Host侧的DOUBLE型参数，指定空间大小的width维度乘数, 取值范围0或[1/64, 64]。
- out（aclTensor*，计算输出）：Device侧的aclTensor，数据类型支持FLOAT16、FLOAT、BFLOAT16。支持，支持NCHW，shape维度仅支持4维shape的tensor，数据类型与入参[object Object]的数据类型一致。
- workspaceSize（uint64_t*，出参）：返回需要在Device侧申请的workspace大小。
- executor（aclOpExecutor**，出参）：返回op执行器，包含了算子计算流程。
返回值：

aclnnStatus：返回状态码，具体参见。

[object Object]

参数说明：
- workspace （void*，入参）：在Device侧申请的workspace内存地址。
- workspaceSize （uint64_t，入参）：在Device侧申请的workspace大小，由第一段接口aclnnUpsampleBicubic2dAAGetWorkspaceSize获取。
- executor（aclOpExecutor*，入参）：op执行器，包含了算子计算流程。
- stream（aclrtStream，入参）：指定执行任务的 AscendCL Stream流。
返回值：

aclnnStatus：返回状态码，具体参见。

[object Object]

示例代码如下，仅供参考，具体编译和执行过程请参考。

[object Object]