aclRfft1D-融合算子接口-算子加速库接口-CANN社区版8.0.0.alpha002开发文档-昇腾社区

[object Object][object Object]

Atlas A2训练系列产品/Atlas 800I A2推理产品。

[object Object]

每个算子分为两段式接口，必须先调用“aclRfft1DGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器，再调用“aclRfft1D”接口执行计算。

aclnnStatus aclRfft1DGetWorkspaceSize(const aclTensor* self, int64_t n, int64_t dim, int64_t norm, aclTensor* out, uint64_t* workspaceSize, aclOpExecutor** executor)
aclnnStatus aclRfft1D(void *workspace, uint64_t workspaceSize, aclOpExecutor *executor, aclrtStream stream)

[object Object]

算子功能：aclRfft1D计算张量self的RFFT
计算公式： $X_{k}=\sum _{n=0}^{N-1}x_{n}\cdot e^{-i2\pi {\tfrac {k}{N}}n}$
示例：假设self为 {1, 2, 3, 4} 则out = {10, 0, -2, 2, -2, 0} = {10 + 0j, -2 + 2j, -2 + 0j} （自定义）

[object Object]

参数说明：
- self(aclTensor*, calculation input): 即公式中的输入。数据类型：FLOAT。数据格式：ND。不支持不连续的Tensor。.
- n(int64_t, calculation optional attribute): 表示信号长度。数据类型：INT64。如果给定，则在计算Rfft1D之前，输入将被补零或修剪到此长度。支持的最大值为262144。
- dim(int64_t, calculation optional attribute): 表示维度。数据类型：INT64。如果给定，则RFFT将应用于指定的维度。支持的值为-1。
- norm(int64_t, calculation optional attribute): 表示归一化模式。数据类型：INT64。默认值为1。1表示不归一化，2表示按1/n归一化，3表示按1/sqrt(n)归一化。
- out (aclTensor*, calculated output): 表示公式中的输出。数据类型：FLOAT。数据格式：ND。不支持不连续的张量。
- workspaceSize (uint64_t, input parameter): NPU设备上申请的workspace大小，在第一段调用aclRfft1DGetWorkspaceSize接口获取。
- executor(aclOpExecutor*, input parameter): 算子执行器，包含算子计算过程。
返回值：

aclnnStatus：返回状态码，具体参见aclnn返回码。

[object Object]

[object Object]

参数说明：
- workspace（void*, 入参）：在Device侧申请的workspace内存地址。
- workspaceSize（uint64_t, 入参）：在Device侧申请的workspace大小，由第一段接口aclRfft1DGetWorkspaceSize获取。
- executor（aclOpExecutor*, 入参）：op执行器，包含了算子计算流程。
- stream（aclrtStream, 入参）：指定执行任务的AscendCL Stream流。
返回值：

aclnnStatus：返回状态码，具体参见aclnn返回码。

[object Object]

第1种情况：支持"n"的范围[1, 4096]和2的n次幂最大262144
第2种情况：支持的"dim"值为-1
第3种情况：支持的"norm"值为1、2、3

[object Object]

[object Object]