功能介绍
若基本调优操作不能达到性能要求,您可以借助Profiling工具进行训练过程中的性能数据采集,并进行分析,从而准确定位系统的软、硬件性能瓶颈,提高性能分析的效率,通过针对性的性能优化方法,以最小的代价和成本实现业务场景的极致性能。
当前Profiling支持采集的性能数据主要包括:
- training_trace:迭代轨迹数据,即训练任务及AI软件栈的软件信息,实现对训练任务的性能分析,重点关注数据增强、前后向计算、梯度聚合更新等相关数据。
- task_trace:任务轨迹数据,即昇腾AI处理器HWTS/AICore的硬件信息,分析任务开始、结束等信息。
默认训练过程中不采集Profiling性能数据,如需采集,请参考本节内容通过修改训练脚本或者开启环境变量的方式开启训练过程中采集Profiling数据并解析导出,然后进行性能数据的分析。
父主题: Profiling数据采集与分析