简介
Profiling实现了Host+Device侧丰富的性能数据采集能力和全景Timeline交互分析能力,展示Host+Device侧各项性能指标,帮助用户快速发现和定位AI应用、芯片及算子的性能瓶颈。包括资源瓶颈导致的AI算法短板,指导算法性能提升和系统资源利用率的优化。Profiling支持Host+Device侧的资源利用可视化统计分析,具体包括Host侧CPU、Memory、Disk、Network利用率和Device侧APP工程的硬件和软件性能数据。
Profiling提供针对硬件和软件性能数据采集、分析、汇总展示。总体流程如下:
- 运行Profiling采集。
用户在配置界面开启Profiling开关(推理场景需确保APP工程可正常执行;训练场景直接执行采集)。
- Profiling采集性能数据。
MindStudio编译当前工程生成可执行文件,并将可执行文件拷贝到设备侧,MindStudio向Profiling工具下发数据采集指令,由Profiling工具完成Device侧和Host侧数据采集任务,采集结束后,将生成的数据文件拷贝到MindStudio侧。
- MindStudio查询并解析数据。
Profiling采集结束后,MindStudio调用Profiling工具接口查询数据,并将数据以json格式存储在“.mindstudio/profiler/data/profiling_out/PROF_XXX”目录下。
- MindStudio展示性能数据。
MindStudio通过对json文件做数据处理,生成前端展示视图数据。
- Profiling采集性能数据。
父主题: Profiling性能分析