aclnnRoiAlignV2-NN算子接口-算子加速库接口-CANN社区版8.0.0.alpha003开发文档-昇腾社区

[object Object][object Object]

[object Object]Atlas 训练系列产品[object Object]。
[object Object]Atlas A2 训练系列产品/Atlas 800I A2 推理产品[object Object]。

[object Object]

每个算子分为，必须先调用“aclnnRoiAlignV2GetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器，再调用“aclnnRoiAlignV2”接口执行计算。

[object Object]
[object Object]

[object Object]

算子功能：RoiAlign是一种池化层，用于非均匀输入尺寸的特征图，并输出固定尺寸的特征图。对标ONNX opset 10算子原型，aclnnRoiAlignV2对标torchvision算子原型。aclnnRoiAlignV2使用boxes替代aclnnRoiAlign的rois和batch_indices，并增加aligned入参，同时取消mode入参、默认执行mode="avg"场景。

[object Object]

参数说明：
- self（aclTensor*，计算输入）：图像特征图输入。Device侧的aclTensor，数据类型支持FLOAT16、FLOAT，必须与boxes、out数据类型一致。支持，支持NCHW。维度为4维，shape为（B，C，inputHeight，inputWidth），表示输入张量一个batch内有B张图像，每个图像有C个尺寸为inputHeight * inputWidth的特征图。
- boxes（aclTensor*，计算输入）：感兴趣区域box坐标。Device侧的aclTensor，数据类型支持FLOAT16、FLOAT，必须与self、out数据类型一致。支持，支持ND。维度为2维，shape为（K，5），5代表box相关信息（image_id，x1，y1，x2，y2），K需要与boxes第0维保持一致。
- pooledHeight（int64_t，计算输入）：池化后输出图像的高度。Host侧的输入参数。
- pooledWidth（int64_t，计算输入）：池化后输出图像的宽度。Host侧的输入参数。
- spatialScale（float，计算输入）：乘法空间尺度因子，将ROI坐标从其输入空间尺度转换为池化时使用的尺度，即输入特征图X相对于输入图像的空间尺度。Host侧的输入参数，需大于0。
- samplingRatio（int64_t，计算输入）：计算每个输出元素的和W上的bin数。Host侧的输入参数，需大于等于0。
- aligned（bool，计算输入）：如果为false，则对齐版本实现；如果为true，则box坐标像素偏移-0.5来使相邻像素索引更好对齐。Host侧的输入参数。
- out（aclTensor*，计算输出）：池化后的输出。Device侧的aclTensor，数据类型支持FLOAT16、FLOAT，必须与self、boxes数据类型一致。支持，支持NCHW。维度为4维，shape为（K，C，pooledHeight，pooledWidth），表示输出张量一个batch内有K个元素，每个元素有C个尺寸为pooledHeight * pooledWidth的特征图。
- workspaceSize（uint64_t*，出参）：返回需要在Device侧申请的workspace大小。
- executor（aclOpExecutor**，出参）：返回op执行器，包含了算子计算流程。
返回码：

aclnnStatus：返回状态码，具体参见。

[object Object]

参数说明：
- workspace（void*，入参）：在Device侧申请的workspace内存地址。
- workspaceSize（uint64_t，入参）：在Device侧申请的workspace大小，由第一段接口aclnnRoiAlignV2GetWorkspaceSize获取。
- executor（aclOpExecutor*，入参）：op执行器，包含了算子计算流程。
- stream（aclrtStream，入参）：指定执行任务的AscendCL Stream流。
返回码：

aclnnStatus：返回状态码，具体参见。

[object Object]

无

[object Object]

示例代码如下，仅供参考，具体编译和执行过程请参考。

[object Object]