简介
进行性能调优时,可以使用性能分析工具采集和分析运行在昇腾AI处理器上的AI任务各个运行阶段的关键性能指标,用户可根据输出的性能数据,快速定位软、硬件性能瓶颈,提升AI任务性能分析的效率。

本文提供了多种性能数据采集方式,从便捷性角度考虑,离线推理场景推荐使用msprof命令行工具方式采集,如果当前环境未安装Ascend-cann-toolkit开发套件包,则无法使用msprof命令行工具。 训练场景推荐直接在AI框架内修改接口参数采集。使用msprof命令行方式采集和Ascend PyTorch Profiler接口采集时,在采集后可以自动进行性能数据解析和导出,其余方式需要使用msprof命令行或msprof.py工具,将采集到的数据进行解析和导出。
图1 性能分析总体流程
