aclnnCumprod-NN算子接口-算子加速库接口-CANN社区版8.0.0.alpha003开发文档-昇腾社区

[object Object][object Object]

[object Object]

每个算子分为，必须先调用 [object Object]接口获取计算所需workspace大小以及包含了算子计算流程的执行器，再调用[object Object]接口执行计算。

对于原地更新接口，先调用[object Object]接口获取计算所需workspace大小以及包含了算子计算流程的执行器，再调用[object Object]接口执行计算。

[object Object]

算子功能：新增aclnnCumprod接口，[object Object]函数用于计算输入张量在指定维度上的累积乘积。例如，如果有一个张量表示一系列的数值，[object Object]可以计算出这些数值从开始位置到当前位置的乘积序列。
计算公式：

一维张量（向量）情况

当对于一维张量，累积乘积 $y=[y_1,y_2,y_3...,y_n]$ 的计算公式为:

$y_1=x_1$ $y_2=x_1 \times x_2$ $y_3=x_1 \times x_2\times x_3$ ... $y_n=x_1\times x_2\times x_3\times x_n$

用数学公式表示 $y_i=\prod_{j=1}^ix_j, 其中i=1,2...,n$
高维张量情况(以二维张量为例, dim=0 沿行方向)

对于二维张量 $X=\begin{bmatrix}x_{11}&x_{12}&...&x_{1m}\\x_{21}&x_{22}&...&x_{2m}\\...&...&...&...&\\x_{n1}&x_{n2}&...&x_{nm}&\end{bmatrix}$

计算后的结果张量

$Y=\begin{bmatrix}y_{11}&y_{12}&...&y_{1m}\\y_{21}&y_{22}&...&y_{2m}\\...&...&...&...&\\y_{n1}&y_{n2}&...&y_{nm}&\end{bmatrix}$

对于第一列(j=1):

$y_{i1}=x_{11}\times x_{21}\times ...\times x_{i1}(对于i=1,2,....n)$

所以对于任意列j，也有类似规律，即:

$y_{ij}=\prod_{k=1}^{i} x_{kj}$
高维张量情况(以二维张量为例, dim=1 沿列方向情况)

所以对于任意列j，也有类似规律，即:

$y_{ij}=\prod_{k=1}^{j} x_{ik}$
其它参数可以类似地根据上述规则进行推导

[object Object]

参数说明：
- input（aclTensor*, 计算输入）：当前输入值，表示需要计算累积乘积的数据，Device侧的aclTensor，支持，支持空Tensor。数据类型支持FLOAT、FLOAT16、BFLOAT16、DOUBLE、INT8、INT16、INT32、INT64,、UNIT8、UINT16、UINT32、UINT64、COMPLEX64、COMPLEX128; 支持ND。
- dim（aclScalar*, 计算输入）：当前输入值，指定计算累积乘积的维度，对于一个二维张量，dim=0表示沿着行方向计算，dim=1表示沿列方向计算，Device侧的aclScalar, 取值范围 [-rank(input), rank(input))。数据类型支持INT32。
- dtype（aclDataType, 计算输入）：需要和out数据类型一致。如果未指定([object Object]），那么与input、out的类型一致；如果指定，那么input在计算前将其转换为此种数据类型。支持数据类型默认和输入类型一致。
- out（aclTensor*, 计算输出）：累积乘积的结果，Device侧的aclTensor，支持ND。支持数据类型默认和输入类型一致,shape与input一致。
- workspaceSize（uint64_t*，出参）：返回用户需要在Device侧申请的workspace大小。
- executor（aclOpExecutor**，出参）：返回op执行器，包含了算子计算流程。
返回值：

aclnnStatus：返回状态码，具体参见。

[object Object]

[object Object]

参数说明：
- input（aclTensor*, 计算输入）：当前输入值，表示需要计算累积乘积的数据，Device侧的aclTensor，支持，不支持空Tensor。数据类型支持FLOAT、FLOAT16、BFLOAT16、DOUBLE、INT8、INT16、INT32、INT64,、UNIT8、UINT16、UINT32、UINT64、COMPLEX64、COMPLEX128; 支持ND。
- dim（aclScalar*, 计算输入）：当前输入值，指定计算累积乘积的维度，对于一个二维张量，axis=0表示沿着行方向计算，axis=1表示沿列方向计算，Device侧的aclScalar，取值范围 [-rank(x), rank(x))。数据类型支持INT32。
- workspaceSize（uint64_t*，出参）：返回用户需要在Device侧申请的workspace大小。
- executor（aclOpExecutor**，出参）：返回op执行器，包含了算子计算流程。
返回值：

aclnnStatus：返回状态码，具体参见。

[object Object]

[object Object]

参数说明：
- workspace(void *, 入参)：在Device侧申请的workspace内存起址。
- workspaceSize(uint64_t, 入参)：在Device侧申请的workspace大小，由第一段接口aclnnCumprodGetWorkspaceSize获取。
- executor(aclOpExecutor *, 入参)：op执行器，包含了算子计算流程。
- stream(aclrtStream, 入参)：指定执行任务的 AscendCL Stream流。
返回值：

aclnnStatus: 返回状态码，具体参见。

[object Object]

参数说明：
- workspace(void *, 入参)：在Device侧申请的workspace内存起址。
- workspaceSize(uint64_t, 入参)：在Device侧申请的workspace大小，由第一段接口aclnnInplaceCumprodGetWorkspaceSize获取。
- executor(aclOpExecutor *, 入参)：op执行器，包含了算子计算流程。
- stream(aclrtStream, 入参)：指定执行任务的 AscendCL Stream流。
返回值：

aclnnStatus: 返回状态码，具体参见。

[object Object]

无

[object Object]

示例代码如下，仅供参考，具体编译和执行过程请参考。

[object Object]