Roofline分析图
Roofline分析图可构建出芯片的性能模型,然后利用该性能模型快速评估出算子的理论性能极限,帮助开发者快速识别瓶颈类型。
通过msprof op生成的visualize_data.bin文件可导入MindStudio Insight进行可视化呈现,并针对不同的硬件以及算子类型会生成不同的Roofline分析视图。
- Atlas 推理系列产品的Roofline分析图中仅有内存单元视图。
图1 Atlas 推理系列产品Roofline分析图
- Atlas A2训练系列产品根据算子类型不同而产生不同的视图,具体请参见表1。
图2 Atlas A2训练系列产品Roofline分析图
Roofline分析视图分析算子的性能利用率,并提供以下客观分析结果:
- 算子性能利用率大于80%时,按照所在区域进行提示,有以下两种情况。
- Compute Bound:计算瓶颈。
- Memory Bound:内存瓶颈。
- 算子性能利用率小于80%,Bound类型为Latency Bound,有以下三种情况:
- 若最大的pipeline ratio小于80%,提示latency bound:pipeline caused。
- 若最大的pipeline ratio大于80%,需识别最大pipeline ratio的类型。
- 若最大pipeline ratio的类型是compute pipeline (cube ratio、vector ratio、scalar ratio),提示latency bound:compute caused。
- 若最大pipeline ratio的类型是memory pipeline(mte1 ratio、mte2 ratio、mte3 ratio),提示latency bound:memory caused。
父主题: msProf