run_profiling
函数功能
通用的Profiling运行接口。在NPU板端拉起kernel.o文件并灌入输入数据,打开Profiling运行算子逻辑,执行成功后将板端输出数据拷贝到Host侧,自动完成输出数据精度比对。
函数原型
def run_profiling(self, kernel_file: str, profiling_options: RunProfilingOptions, npu_compile_info: NpuCompileInfo = None, tiling_info: TilingInfo = None)
参数说明
参数名 |
输入/输出 |
说明 |
是否必设 |
---|---|---|---|
kernel_file |
输入 |
核函数CCEC编译生成的.o文件。 |
是 |
profiling_options |
输入 |
RunProfilingOptions的实例对象,用户根据实际情况自行设置。 |
是 |
npu_compile_info |
输入 |
NpuCompileInfo的实例对象,用户根据kernel_file编译时的属性进行设置。 |
否 |
tiling_info |
输入 |
TilingInfo的实例对象。
|
否 |
返回值
无
使用说明
支持所有工程算子开发场景,调用示例参见上板Profiling性能采集(标准自定义算子工程场景)和上板Profiling数据采集(核函数直调场景)。
父主题: OpExecutor类