文档
注册

run_npu

函数功能

通用的算子NPU上板运行接口。在NPU板端拉起kernel.o文件并灌入输入数据,运行算子逻辑,执行成功后将板端输出数据拷贝到host侧,自动完成输出数据精度比对。

函数原型

def run_npu(self, kernel_file: str, npu_options: RunNpuOptions, npu_compile_info: NpuCompileInfo = None, tiling_info: TilingInfo = None)

参数说明

参数名

输入/输出

说明

是否必设

kernel_file

输入

核函数编译生成的.o文件。

npu_options

输入

RunNpuOptions的实例对象,用户根据实际情况自行设置。

npu_compile_info

输入

NpuCompileInfo的实例对象,用户根据kernel_file编译时的属性进行设置。

tiling_info

输入

TilingInfo的实例对象。

  • 核函数直调工程场景:无需设置此参数。
  • 标准自定义算子工程场景:调用run_custom_tiling接口生成Tiling Info信息。
  • ops_adv算子工程场景:调用run_tilingrun_ops_adv_tiling接口生成Tiling Info信息。

返回值

使用说明

支持所有的工程算子开发场景,以标准自定义算子工程场景的调用为例,具体参见核函数NPU上板精度验证

搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词