算子耗时分析

NPU算子耗时统计

NPU的算子耗时统计可直接从profiling数据的device_xx/summary中获取,profiling目录结构如下:

图1 profiling目录结构

Op_summary在PROF_XXX/device_xx/summary下,结构如下:

图2 summary目录结构

分析算子耗时需要重点关注2个文件,一个是算子分类汇总文件op_statistic_xx.csv,另一个是算子详细数据文件op_summary_xx.csv。