上板Profiling数据采集
- 执行如下命令采集上板性能数据。
ascendebug kernel --backend npu --repo-type minimalist --json-file ${op_config_json_file} --core-type ${core_type} --block-num 4 --profiling
命令参数
参数含义
取值说明
--backend
Kernel调测类型。
参数取值与核函数NPU上板精度验证保持一致。
--repo-type
算子开发工程场景类型。
--json-file
算子信息配置文件。
--core-type
算子类型。
--block-num
设置运行Kernel时起的核数。
--profiling
使能上板profiling数据采集功能。
无配置值。
- 性能分析结果存放在${work_dir}/${op_type}/npu/output下,${work_dir}为当前工作目录,${op_type}为算子名,具体示例可以参见“Profiling数据采集功能 > 调测产物”。
父主题: 性能调优