下载
中文
注册

acldvppGaussianBlur

Atlas 200/300/500 推理产品不支持该算子。

Atlas 训练系列产品不支持该算子。

Atlas 推理系列产品不支持该算子。

Atlas 200/500 A2推理产品不支持该算子。

函数功能

算子功能:对图像做高斯模糊。

函数原型

每个算子有两段接口,必须先调用“acldvppGaussianBlurGetWorkspaceSize”接口获取入参并根据计算流程计算所需workspace大小,再调用“acldvppGaussianBlur”接口执行计算。两段式接口如下:

  • acldvppStatus acldvppGaussianBlurGetWorkspaceSize(const aclTensor* self, const aclIntArray* kernelSize, const aclFloatArray* sigma, uint32_t paddingMode, aclTensor* out, uint64_t* workspaceSize, aclOpExecutor** executor)
  • acldvppStatus acldvppGaussianBlur(void* workspace, uint64_t workspaceSize, aclOpExecutor* executor, aclrtStream stream)

acldvppGaussianBlurGetWorkspaceSize

  • 接口定义:

    aclnnStatus acldvppGaussianBlurGetWorkspaceSize(const aclTensor* self, const aclIntArray* kernelSize, const aclFloatArray* sigma, uint32_t paddingMode, aclTensor* out, uint64_t* workspaceSize, aclOpExecutor** executor)

  • 参数说明:
    • self:表示算子输入Tensor,需调用aclCreateTensor接口创建aclTensor类型的数据(数据存放在Device侧),输入Tensor的dataType支持UINT8/FLOAT、Format支持NCHW/NHWC、不支持非连续的Tensor,同时N支持1或空、C支持1或3(1表示输入GRAY图,3表示输入RGB图)。
    • kernelSize: 高斯核的尺寸,该参数是一个长度为2的数组,数组内的第一个元素是宽、第二个元素是高,宽和高只能设置为1,3或者5。
    • sigma:高斯核的标准差,该值必须是正数。该参数是一个长度为2的数组,数组内的第一个元素是x方向的标准差、第二个元素是y方向的标准差。
    • paddingMode:填充模式,该参数取值如下:
      • 0:CONSTANT,填充固定值
      • 2:REFLECT,边界元素的镜像,镜像不包括边界元素。举例,其中*表示任意图像元素:cb|abc****fgh|gf
    • out:表示算子输出Tensor,需调用aclCreateTensor接口创建aclTensor类型的数据(数据存放在Device侧),输出Tensor的dataType支持UINT8/FLOAT、Format支持NCHW/NHWC、不支持非连续的Tensor,同时N只支持1、C支持1和3(1表示GRAY图,3表示RGB图),dataType、Format、Shape需要和self一致。
    • workspaceSize:返回用户需要在Device侧申请的workspace大小。
    • executor:返回op执行器,包含了算子计算流程。
  • 返回值:

    返回acldvppStatus状态码,具体请参见acldvpp返回码

acldvppGaussianBlur

  • 接口定义:

    acldvppStatus acldvppGaussianBlur(void* workspace, uint64_t workspaceSize, aclOpExecutor* executor, aclrtStream stream)

  • 参数说明:
    • workspace:需调用aclrtMalloc接口申请Device内存,内存大小为workspaceSize,aclrtMalloc接口输出的内存地址在此处传入。
    • workspaceSize:与acldvppGaussianBlurGetWorkspaceSize接口获取的workspaceSize保持一致。
    • executor:op执行器,包含了算子计算流程,与acldvppGaussianBlurGetWorkspaceSize接口的executor保持一致。
    • stream:指定执行任务的Stream,可复用已创建的Stream节省资源或调用aclrtCreateStream接口创建Stream,再作为入参在此处传入。
  • 返回值:

    返回acldvppStatus状态码,具体请参见acldvpp返回码

约束与限制

支持图像分辨率范围在[6*4~4096*8192]。