简介
进行性能调优时,可以使用性能调优工具来采集和分析运行在昇腾AI处理器上的AI任务各个运行阶段的关键性能指标,用户可根据输出的性能数据,快速定位软、硬件性能瓶颈,提升AI任务性能分析的效率。
为方便用户使用,本文提供了多种性能数据采集方式,下面从便捷性角度给出选取建议:
推理场景推荐使用msprof命令采集,请参见推理场景性能分析快速入门。如果当前环境未安装Ascend-cann-toolkit开发套件包,则无法使用msprof命令。
训练场景推荐直接在AI框架内修改接口参数采集,请参见PyTorch训练场景性能分析快速入门和TensorFlow训练场景性能分析快速入门。


当用户使用msprof命令或使用PyTorch框架接口采集性能数据后,无需使用msprof进行数据解析,这是因为这两种方式在采集后可自动解析;其余采集方式,在采集完成后,需要使用msprof命令进行数据解析。