acldvppPad
Atlas 200/300/500 推理产品不支持该算子。
Atlas 训练系列产品不支持该算子。
Atlas 推理系列产品不支持该算子。
Atlas 200/500 A2推理产品不支持该算子。
函数功能
算子功能:对图像做边界填充。
函数原型
每个算子有两段接口,必须先调用“acldvppPadGetWorkspaceSize”接口获取入参并根据计算流程计算所需workspace大小,再调用“acldvppPad”接口执行计算。两段式接口如下:
- acldvppStatus acldvppPadGetWorkspaceSize(const aclTensor *self, const aclIntArray* padding, uint32_t paddingMode, const aclFloatArray* fill, aclTensor *out, uint64_t *workspaceSize, aclOpExecutor **executor)
- acldvppStatus acldvppPad(void* workspace, uint64_t workspaceSize, aclOpExecutor* executor, aclrtStream stream)
acldvppPadGetWorkspaceSize
- 接口定义:
acldvppStatus acldvppPadGetWorkspaceSize(const aclTensor *self, const aclIntArray* padding, uint32_t paddingMode, const aclFloatArray* fill, aclTensor *out, uint64_t *workspaceSize, aclOpExecutor **executor)
- 参数说明:
- self:表示算子输入Tensor,需调用aclCreateTensor接口创建aclTensor类型的数据(数据存放在Device侧),输入Tensor的dataType支持UINT8/FLOAT、Format支持NCHW/NHWC、不支持非连续的Tensor,同时N支持1或空、C支持1和3(1表示输入GRAY图,3表示输入RGB图)。
- padding: 表示四周边框填充宽度。需调用aclCreateIntArray接口创建参数aclIntArray类型的数据,长度为4,分别表示左、上、右、下四个方向上填充宽度,宽度范围[0, 2048]。
- paddingMode:填充模式,该参数取值如下:
- 0:CONSTANT,填充固定值
- 1:EDGE,重复最后一个元素。举例,其中*表示任意图像元素: aaaaaa|a*****h|hhhhhhh
- 2:REFLECT,边界元素的镜像,镜像不包括边界元素。举例,其中*表示任意图像元素:cb|abc****fgh|gf
- 3:SYMMETRIC,边界元素的镜像,镜像包括边界元素。举例,其中*表示任意图像元素:ba|abc****fgh|hg
- fill: fill是一个长度为3的数组,用于设置每个通道上填充的值,需调用aclCreateFloatArray接口创建参数aclFloatArray类型的数据,仅在paddingMode为CONSTANT时fill参数有效。如果C为1(表示GRAY图),填充fill[0];如果C为3(表示RGB图),按照R、G、B顺序依次填写fill[0]、fill[1]、fill[2]。
- out:表示算子输出Tensor,需调用aclCreateTensor接口创建aclTensor类型的数据(数据存放在Device侧),输出Tensor的dataType支持UINT8/FLOAT、Format支持NCHW/NHWC、不支持非连续的Tensor,同时N只支持1、C支持1和3(1表示GRAY图,3表示RGB图),dataType、Format需要和self一致,Shape中的N轴、C轴大小需要和self一致,Shape中的W轴、H轴大小需和填充后的宽、高保持一致。
- workspaceSize:返回用户需要在Device侧申请的workspace大小。
- executor:返回op执行器,包含了算子计算流程。
- 返回值:
返回acldvppStatus状态码,具体请参见acldvpp返回码。
acldvppPad
- 接口定义:
acldvppStatus acldvppPad(void* workspace, uint64_t workspaceSize, aclOpExecutor* executor, aclrtStream stream)
- 参数说明:
- 返回值:
返回acldvppStatus状态码,具体请参见acldvpp返回码。
约束与限制
支持图像分辨率范围在[6*4~32768*32768]。
父主题: DVPP算子接口