aclnnCtcLoss-NN算子接口-算子加速库-CANN商用版8.0.RC3开发文档-昇腾社区

[object Object][object Object]

Atlas 推理系列产品。
Atlas 训练系列产品。
Atlas A2训练系列产品/Atlas 800I A2推理产品。

[object Object]

每个算子分为，必须先调用“aclnnCtcLossGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器，再调用“aclnnCtcLoss”接口执行计算。

[object Object]
[object Object]

[object Object]

算子功能：计算连接时序分类损失值。
计算表达式：

定义 $y_{k}^{t}$ 表示在时刻 $t$ 时真实字符为 $k$ 的概率。(一般地， $y_{k}^{t}$ 是经过softmax之后的输出矩阵中的一个元素)。将字符集 $L^{'}$ 可以构成的所有序列的集合称为 $L^{'T}$ ，将 $L^{'T}$ 中的任意一个序列称为路径，并标记为 $π$ 。 $π$ 的分布为公式(1)：
$p(π|x)=\prod_{t=1}^{T}y^{t}_{π_{t}} , \forall π \in L'^{T}. \tag{1}$
定义多对一(many to one)映射B: $L^{'T} \to L^{\leq T}$ ，通过映射B计算得到 $l \in L^{\leq T}$ 的条件概率，等于对应于 $l$ 的所有可能路径的概率之和，公式(2):
$p(l|x)=\sum_{π \in B^{-1}(l)}p(π|x).\tag{2}$
将找到使 $p(l|x)$ 值最大的 $l$ 的路径的任务称为解码，公式(3)：
$h(x)=^{arg \ max}_{l \in L^{ \leq T}} \ p(l|x).\tag{3}$

[object Object]

参数说明：
- logProbs(aclTensor*, 计算输入): 表示输出的对数概率，Device侧的aclTensor。数据类型支持FLOAT、DOUBLE。shape为( $T, N, C$ )， $T$ 为输入长度， $N$ 为批处理大小， $C$ 为类别数，必须大于0，包括空白标识。支持。支持ND。
- targets(aclTensor*, 计算输入): 表示包含目标序列的标签，Device侧的aclTensor。数据类型支持INT64、INT32、BOOL、FLOAT、FLOAT16。当shape为( $N, S$ )， $S$ 为不小于 $targetLengths$ 中的最大值的值；或者shape为(SUM( $targetLengths$ ))，假设 $targets$ 是未填充的而且在1维内级联的。支持。支持ND。
- inputLengths(aclIntArray*, 计算输入)：表示输入序列的实际长度，Host侧的aclIntArray。数组长度为 $N$ ，数组中的每个值必须小于等于 $T$ 。
- targetlengths(aclIntArray*, 计算输入)：表示目标序列的实际长度，Host侧的aclIntArray。数组长度为 $N$ ，当targets的shape为( $N, S$ )时，数组中的每个值必须小于等于 $S$ 。
- blank(int, 计算输入)：表示空白标识，Host侧的整型。数值必须小于 $C$ 大于等于0。
- zeroInfinity(bool, 计算输入)：表示是否将无限损耗和相关梯度归零，Host侧的bool类型。
- negLogLikelihoodOut(aclTensor*, 计算输出): 表示输出的损失值，Device侧的aclTensor。数据类型FLOAT、DOUBLE，且数据类型必须和logProbs一致。shape大小为( $N$ )的Tensor。支持。支持ND。
- logAlphaOut(aclTensor*, 计算输出): 表示输入到目标的可能跟踪的概率，Device侧的aclTensor。数据类型支持FLOAT、DOUBLE，且数据类型必须和logProbs一致。shape为3维。支持。支持ND。
- workspaceSize(uint64_t*, 出参): 返回需要在Device侧申请的workspace大小。
- executor(aclOpExecutor**, 出参): 返回op执行器，包含了算子计算流程。
返回值：

aclnnStatus: 返回状态码，具体参见。

[object Object]

[object Object]

参数说明：
- workspace(void*, 入参): 在Device侧申请的workspace内存地址。
- workspaceSize(uint64_t, 入参): 在Device侧申请的workspace大小，由第一段接口aclnnCtcLossGetWorkspaceSize获取。
- executor(aclOpExecutor*, 入参): op执行器，包含了算子计算流程。
- stream(aclrtStream, 入参): 指定执行任务的 AscendCL Stream流。
返回值：

aclnnStatus: 返回状态码，具体参见。

[object Object]

无

[object Object]

示例代码如下，仅供参考，具体编译和执行过程请参考。

[object Object]