acldvppWarpAffine

支持的产品型号

Atlas A2训练系列产品/Atlas 800I A2推理产品

函数功能

算子功能：对图像做仿射变换。

函数原型

每个算子有两段接口，必须先调用“acldvppWarpAffineGetWorkspaceSize”接口获取入参并根据计算流程计算所需workspace大小，再调用“acldvppWarpAffine”接口执行计算。两段式接口如下：

acldvppStatus acldvppWarpAffineGetWorkspaceSize(const aclTensor *self, const aclFloatArray* matrix, uint32_t interpolationMode, uint32_t paddingMode, const aclFloatArray* fill, aclTensor *out, uint64_t *workspaceSize, aclOpExecutor **executor)
acldvppStatus acldvppWarpAffine(void* workspace, uint64_t workspaceSize, aclOpExecutor* executor, aclrtStream stream)

acldvppWarpAffineWorkspaceSize

接口定义：
acldvppStatus acldvppWarpAffineGetWorkspaceSize(const aclTensor *self, const aclFloatArray* matrix, uint32_t interpolationMode, uint32_t paddingMode,const aclFloatArray* fill, aclTensor *out, uint64_t *workspaceSize, aclOpExecutor **executor)
参数说明：
- self：表示算子输入Tensor，需调用aclCreateTensor接口创建aclTensor类型的数据（数据存放在Device侧），输入Tensor的dataType支持UINT8/FLOAT、Format支持NCHW/NHWC、不支持非连续的Tensor，同时N支持1或空、C支持1或3（1表示输入GRAY图，3表示输入RGB图）。
- matrix：长度为6的一维数组，数组中依次存放2*3的仿射变换矩阵数据。
  数据存放示例如下：
- interpolationMode：表示缩放算法，该参数的取值范围如下：
  - 0：bilinear算法
  - 1：nearest算法
- paddingMode：填充模式，该参数取值如下：
  - 0：CONSTANT，填充固定值
  - 1：EDGE，重复最后一个元素。举例，其中*表示任意图像元素: aaaaaa|a*****h|hhhhhhh
- fill: fill是一个长度为3的数组，用于设置每个通道上填充的值，需调用aclCreateFloatArray接口创建参数aclFloatArray类型的数据，仅在paddingMode为CONSTANT时fill参数有效。如果C为1（表示GRAY图），填充fill[0]；如果C为3（表示RGB图），按照R、G、B顺序依次填写fill[0]、fill[1]、fill[2]。
- out：表示算子输出Tensor，需调用aclCreateTensor接口创建aclTensor类型的数据（数据存放在Device侧），输出Tensor的dataType支持UINT8/FLOAT、Format支持NCHW/NHWC、不支持非连续的Tensor，同时N只支持1、C支持1和3（1表示GRAY图，3表示RGB图），dataType、Format、Shape需要和self一致。
- workspaceSize：返回用户需要在Device侧申请的workspace大小。
- executor：返回op执行器，包含了算子计算流程。
返回值：
返回acldvppStatus状态码，具体请参见acldvpp返回码。

acldvppWarpAffine

接口定义：
acldvppStatus acldvppWarpAffine(void* workspace, uint64_t workspaceSize, aclOpExecutor* executor, aclrtStream stream);
参数说明：
- workspace：需调用aclrtMalloc接口申请Device内存，内存大小为workspaceSize，aclrtMalloc接口输出的内存地址在此处传入。
- workspaceSize：与acldvppWarpAffineGetWorkspaceSize接口获取的workspaceSize保持一致。
- executor：op执行器，包含了算子计算流程，与acldvppWarpAffineGetWorkspaceSize接口的executor保持一致。
- stream：指定执行任务的Stream，可复用已创建的Stream节省资源或调用aclrtCreateStream接口创建Stream，再作为入参在此处传入。
返回值：
返回acldvppStatus状态码，具体请参见acldvpp返回码。

约束与限制

支持图像分辨率范围在[6*4~32768*32768]。
变换矩阵大小是2*3。
输入输出格式宽高保持一致。

父主题： DVPP算子接口