下载
中文
注册

Extract

函数功能

处理Sort的结果数据,输出排序后的value和index。

函数原型

1
2
template <typename T>
__aicore__ inline void Extract(const LocalTensor<T> &dstValueLocal, const LocalTensor<uint32_t> &dstIndexLocal, const LocalTensor<T> &sortedLocal, const int32_t repeatTimes)

参数说明

表1 模板参数说明

参数名称

功能

T

操作数的数据类型。

表2 参数说明

参数名称

输入/输出

含义

dstValueLocal

输出

目的操作数。

类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。

LocalTensor的起始地址需要32字节对齐。

Atlas A2 训练系列产品/Atlas 800I A2 推理产品,支持的数据类型为:half/float

Atlas 推理系列产品AI Core,支持的数据类型为:half/float

dstIndexLocal

输出

目的操作数。

类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。

LocalTensor的起始地址需要32字节对齐。

此源操作数固定为uint32_t数据类型。

sortedLocal

输入

源操作数。

类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。

LocalTensor的起始地址需要32字节对齐。

源操作数的数据类型需要与目的操作数保持一致。

Atlas A2 训练系列产品/Atlas 800I A2 推理产品,支持的数据类型为:half/float

Atlas 推理系列产品AI Core,支持的数据类型为:half/float

repeatTimes

输入

重复迭代次数,int32_t类型。

Atlas A2 训练系列产品/Atlas 800I A2 推理产品,每次迭代处理64个float类型数据或128个half类型数据

Atlas 推理系列产品AI Core,每次迭代完成16个Region Proposals的元素抽取并排布到16个元素里,下次迭代跳至相邻的下一组16个Region Proposals和下一组16个元素

取值范围:repeatTimes∈[0,255]。

返回值

支持的型号

Atlas A2 训练系列产品/Atlas 800I A2 推理产品

Atlas 推理系列产品AI Core

约束说明

调用示例

请参见MrgSort的调用示例。