run_npu
函数功能
通用的算子NPU上板运行接口。在NPU板端拉起kernel.o文件并灌入输入数据,运行算子逻辑,执行成功后将板端输出数据拷贝到host侧,自动完成输出数据精度比对。
函数原型
def run_npu(self, kernel_file: str, npu_options: RunNpuOptions, npu_compile_info: NpuCompileInfo = None, tiling_info: TilingInfo = None)
参数说明
参数名 |
输入/输出 |
说明 |
是否必设 |
---|---|---|---|
kernel_file |
输入 |
核函数CCEC编译生成的.o文件。 |
是 |
npu_options |
输入 |
RunNpuOptions的实例对象,用户根据实际情况自行设置。 |
是 |
npu_compile_info |
输入 |
NpuCompileInfo的实例对象,用户根据kernel_file编译时的属性进行设置。 |
否 |
tiling_info |
输入 |
TilingInfo的实例对象。
|
否 |
返回值
无
使用说明
支持所有的工程算子开发场景,调用示例参见核函数NPU上板精度验证(标准自定义算子工程场景)和核函数NPU上板精度验证(核函数直调场景)。
父主题: OpExecutor类