下载
中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助
昇腾小AI

compile_call_kernel_npu

函数功能

核函数直调工程算子开发场景的算子NPU侧编译接口。根据用户配置信息,进行算子源码CCEC编译,生成kernel.o文件。

函数原型

def compile_call_kernel_npu(self, kernel_info: OpKernelInfo, options: CompileNpuOptions)

参数说明

参数名

输入/输出

说明

是否必设

kernel_info

输入

OpKernelInfo结构体对象,包含核函数源文件、入口函数、头文件路径相关信息。

options

输入

CompileNpuOptions的实例对象,用户根据实际情况自行设置。

返回值

函数返回如下三个结果:

  • kernel name。
  • kernel.o绝对路径文件名。
  • 编译信息dict:
    • 关键字'cross_core_sync'值是bool类型,表示是否开启硬同步syncall。
    • 关键字'task_ration'值是list类型,表示核函数运行时的core分配方案。

使用说明

仅支持核函数直调工程算子开发场景,调用示例参见核函数NPU上板精度验证

搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词