compile_call_kernel_npu
函数功能
核函数直调工程算子开发场景下NPU侧编译接口。根据用户配置信息,进行算子源码编译,生成kernel.o文件。
函数原型
def compile_call_kernel_npu(self, kernel_info: OpKernelInfo, options: CompileNpuOptions)
参数说明
参数名 |
输入/输出 |
说明 |
是否必设 |
---|---|---|---|
kernel_info |
输入 |
OpKernelInfo结构体对象,包含核函数源文件、入口函数、头文件路径相关信息。 |
是 |
options |
输入 |
CompileNpuOptions的实例对象,用户根据实际情况自行设置。 |
是 |
返回值
函数返回如下三个结果:
- kernel name。
- kernel.o绝对路径文件名。
- 编译信息dict:
- 关键字'cross_core_sync'值是bool类型,表示是否开启硬同步syncall。
- 关键字'task_ration'值是list类型,表示核函数运行时的core分配方案。
使用说明
仅支持核函数直调工程算子开发场景,调用示例参见核函数NPU上板精度验证。
父主题: OpExecutor类