aclnnInplaceFillDiagonal-NN算子接口-算子加速库-CANN商用版8.0.RC3开发文档-昇腾社区

[object Object][object Object]

[object Object]

每个算子分为，必须先调用“aclnnInplaceFillDiagonalGetWorkspaceSize”接口获取入参并根据计算流程计算所需workspace大小，再调用“aclnnInplaceFillDiagonal”接口执行计算。

[object Object]

算子功能：以fillValue填充tensor对角线。
计算公式：以二维为例，[object Object]为False时，填充位置为 [object Object]，其中[object Object]，[object Object]，[object Object]为列的长度，[object Object]为行的长度。[object Object]为True时，填充位置为 [object Object]，其中[object Object]，[object Object]，[object Object]为列的长度，[object Object]为行的长度，[object Object]。

[object Object]

参数说明
- selfRef（aclTensor*, 计算输入/输出）：表示输入/输出张量，Device侧的aclTensor。支持，支持ND。
  - Atlas 训练系列产品、Atlas 推理系列产品：数据类型支持FLOAT16、FLOAT、DOUBLE、INT8、INT16、INT32、INT64、UINT8、BOOL。
  - Atlas A2训练系列产品/Atlas 800I A2推理产品：数据类型支持BFLOAT16、FLOAT16、FLOAT、DOUBLE、INT8、INT16、INT32、INT64、UINT8、BOOL。
- fillValue（aclScalar*, 计算输入）：表示填充值，Host侧的aclScalar，数据类型需要是可转换为FLOAT的数据类型。
- wrap（bool, 计算输入）：表示填充方式，公式中的[object Object]，Host侧的BOOL类型。对于高矩阵（行数row大于列数col），若为True，每经过N行形成一条新的对角线，其中[object Object]。
- workspaceSize（uint64_t*, 出参）：返回需要在Device侧申请的workspace大小。
- executor（aclOpExecutor**, 出参）：返回op执行器，包含了算子计算流程。
返回值：

aclnnStatus：返回状态码，具体参见。

[object Object]

[object Object]

参数说明
- workspace（void*, 入参）：在Device侧申请的workspace内存地址。
- workspaceSize（uint64_t, 入参）：在Device侧申请的workspace大小，由第一段接口aclnnInplaceFillDiagonalGetWorkspaceSize获取。
- executor（aclOpExecutor*, 入参）：op执行器，包含了算子计算流程。
- stream（aclrtStream, 入参）：指定执行任务的 AscendCL Stream流。
返回值：

aclnnStatus：返回状态码，具体参见。

[object Object]

无

[object Object]

示例代码如下，仅供参考，具体编译和执行过程请参考。

[object Object]