上板Profiling数据采集
性能分析工具(Profiling)用于采集和分析算子在昇腾AI处理器上运行的关键性能指标,更多功能介绍和全量参数说明参见Profiling数据采集功能。
- 执行如下命令采集上板性能数据。
ascendebug kernel --backend npu --repo-type minimalist --json-file ${op_config_json_file} --core-type ${core_type} --block-num 4 --profiling
命令参数
参数含义
取值说明
--backend
Kernel调测类型。
参数取值与核函数NPU上板精度验证保持一致。
--repo-type
算子开发工程场景类型。
--json-file
算子信息配置文件。
--core-type
算子类型。
--block-num
设置运行Kernel时起的核数。
--profiling
使能上板profiling数据采集功能。
无配置值。
- 性能分析结果文件详情参见“产物说明”。
父主题: 性能调优