文档
注册

compile_custom_npu

函数功能

标准自定义工程算子开发场景下NPU侧编译接口。根据用户配置信息,进行算子源码编译,生成kernel.o文件。

函数原型

def compile_custom_npu(self, customize_path: str, tiling_key: int, options: CompileNpuOptions)

参数说明

参数名

输入/输出

说明

是否必设

customize_path

输入

自定义算子安装包路径。根据实际部署环境配置。

例如${INSTALL_DIR}/opp/vendors/${vendor_name},其中${INSTALL_DIR}为CANN安装包路径,${vendor_name}为部署自定义算子包时设置的vendor名。

tiling_key

输入

Tiling key值。

options

输入

CompileNpuOptions的实例对象,用户根据实际情况自行设置。

返回值

函数返回如下三个结果:

  • kernel name。
  • kernel.o绝对路径文件名。
  • 编译信息dict:
    • 关键字'cross_core_sync'值是bool类型,表示是否开启硬同步syncall。
    • 关键字'task_ration'值是list类型,表示核函数运行时的core分配方案。

使用说明

仅支持标准自定义工程算子开发场景,调用示例参见核函数NPU上板精度验证

搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词