函数:set_kernel_args
C函数原型 |
aclError aclopSetKernelArgs(aclopKernelDesc *kernelDesc, const char *kernelId, uint32_t blockDim, const void *args, uint32_t argSize) |
---|---|
Python函数 |
ret = acl.op.set_kernel_args(kernel_desc, kernel_id, block_dim, args, arg_size) |
函数功能 |
动态Shape场景下,设置算子Tiling参数、执行并发数。 |
输入说明 |
kernel_desc:int,Kernel描述缓存,aclopKernelDesc类型的指针地址。 kernel_id:str,算子执行时要指定的Kernel ID,与调用acl.op.create.kernel时传递的kernel_id一致。 block_dim:int,Kernel执行的并发数。 bin_data:int,算子Kernel文件的内存地址。 bin_size:int,算子Kernel文件的内存大小,单位为Byte。 args:int,Tiling参数,需要通过numpy数组tobytes方法获取bytes对象,然后使用acl.utils.bytes_to_ptr()接口获取Tiling参数指针地址。 arg_size:int,Tiling参数内存大小,单位为Byte,为numpy.tobytes()转换得到bytes的对象长度,可用len函数获取。 |
返回值说明 |
ret:int,错误码。
|
约束说明 |
无 |
参考资源 |
父主题: 单算子模型执行