功能介绍
若基本调优操作不能达到性能要求,您可以借助Profiling工具采集训练过程中的性能数据采集并进行分析,从而准确定位系统的软、硬件性能瓶颈,提高性能分析的效率,通过针对性的性能优化方法,以最小的代价和成本实现业务场景的极致性能。
默认训练过程中不采集Profiling性能数据,如需采集、解析性能数据,请参考本节内容。
TensorFlow网络性能数据采集与分析的整体流程如下所示:
- 采集Profiling数据。
全局采集有两种开启方式,可以通过修改训练脚本、配置“enable_profiling”参数的方式开启(可参见修改训练脚本的方式),也可以通过设置环境变量“ PROFILING_MODE”的方式开启(可参见环境变量方式),其中配置参数“enable_profiling”的优先级高于环境变量“ PROFILING_MODE”。
局部采集,指通过with语句调用TF Adapter 1.x中的Profiler类,并将需要开启性能数据采集的操作放入Profiler类作用域内的方式,详细操作方式可参见局部采集Profiling数据。
- 解析并导出Profiling数据。
不管是何种方式采集的Profiling数据,您都可以通过msprof命令行方式进行数据解析,并将解析结果导出到指定目录,详细操作可参见解析并导出Profiling数据。
- 分析Profiling数据。
您可以通过解析导出得到的结果文件(例如Timeline、Summary文件)进行分析,识别性能瓶颈点,典型分析示例可参见分析Profiling数据。
父主题: Profiling数据采集与分析