compile_custom_npu
函数功能
标准自定义工程算子开发场景的算子NPU侧编译接口。根据用户配置信息,进行算子源码CCEC编译,生成kernel.o文件。
函数原型
def compile_custom_npu(self, customize_path: str, tiling_key: int, options: CompileNpuOptions)
参数说明
参数名 |
输入/输出 |
说明 |
是否必设 |
---|---|---|---|
customize_path |
输入 |
自定义算子安装包路径。根据实际部署环境配置,例如${cann_install_path}/latest/opp/vendors/${vendor_name},其中${cann_install_path}为CANN软件安装包路径,${vendor_name}为部署自定义算子包时设置的vendor名。 |
是 |
tiling_key |
输入 |
Tiling key值。 |
是 |
options |
输入 |
CompileNpuOptions的实例对象,用户根据实际情况自行设置。 |
是 |
返回值
函数返回如下三个结果:
- kernel name。
- kernel.o绝对路径文件名。
- 编译信息dict:
- 关键字'cross_core_sync'值是bool类型,表示是否开启硬同步syncall。
- 关键字'task_ration'值是list类型,表示核函数运行时的core分配方案。
使用说明
仅支持标准自定义工程算子开发场景,调用示例参见核函数NPU上板精度验证。
父主题: OpExecutor类