文档
注册

函数:set_kernel_args

C函数原型

aclError aclopSetKernelArgs(aclopKernelDesc *kernelDesc,

const char *kernelId,

uint32_t blockDim,

const void *args,

uint32_t argSize)

Python函数

ret = acl.op.set_kernel_args(kernel_desc, kernel_id, block_dim, args, arg_size)

函数功能

动态Shape场景下,设置算子Tiling参数、执行并发数。

输入说明

kernel_desc:int,Kernel描述缓存,aclopKernelDesc类型的指针地址

kernel_id:str,算子执行时要指定的Kernel ID,与调用acl.op.create.kernel时传递的kernel_id一致。

block_dim:int,Kernel执行的并发数。

bin_data:int,算子Kernel文件的内存地址。

bin_size:int,算子Kernel文件的内存大小,单位为byte。

args:int,Tiling参数,需要通过numpy数组tobytes方法获取bytes对象,然后使用acl.utils.bytes_to_ptr()接口获取Tiling参数指针地址。

arg_size:int,Tiling参数内存大小,单位为Byte,为numpy.tobytes()转换得到bytes的对象长度,可用len函数获取。

返回值说明

ret:int,错误码。

  • 返回0表示成功。
  • 返回其它值表示失败。

约束说明

参考资源

接口调用流程及示例,参见动态Shape算子(注册算子选择器)

搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词