下载
中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助
昇腾小AI

Roofline分析图

Roofline分析图可构建出芯片的性能模型,然后利用该性能模型快速评估出算子的理论性能极限,帮助开发者快速识别瓶颈类型。

  • 若要使用MindStudio Insight进行查看时,需要单独安装MindStudio Insight软件包,具体下载链接请参见MindStudio Insight用户指南的“安装与卸载”章节
  • MindStudio Insight具体操作请参考MindStudio Insight用户指南的“算子调优 > 详情(Details)”章节。
  • 将visualize_data.bin文件导入MindStudio Insight的具体操作请参考MindStudio Insight用户指南的“导入性能数据”章节。

通过msprof op生成的visualize_data.bin文件可导入MindStudio Insight进行可视化呈现,并针对不同的硬件以及算子类型会生成不同的Roofline分析视图。

  • Atlas 推理系列产品的Roofline分析图中仅有内存单元视图。
    图1 Atlas 推理系列产品Roofline分析图
  • Atlas A2训练系列产品根据算子类型不同而产生不同的视图,具体请参见表1
    图2 Atlas A2训练系列产品Roofline分析图
    表1 Atlas A2训练系列产品支持Roofline视图情况列表

    Roofline视图类型

    Vector算子

    Cube算子

    Mix算子

    HBM+L2视图

    Vector内存单元视图

    -

    Vector内存通路视图

    -

    Vector Pipeline视图

    -

    Cube内存单元视图

    -

    Cube内存通路视图

    -

    Cube Pipeline视图

    -

Roofline分析视图分析算子的性能利用率,并提供以下客观分析结果:
  • 算子性能利用率大于80%时,按照所在区域进行提示,有以下两种情况。
    • Compute Bound:计算瓶颈。
    • Memory Bound:内存瓶颈。
  • 算子性能利用率小于80%,Bound类型为Latency Bound,有以下三种情况:
    • 若最大的pipeline ratio小于80%,提示latency bound:pipeline caused。
    • 若最大的pipeline ratio大于80%,需识别最大pipeline ratio的类型。
      • 若最大pipeline ratio的类型是compute pipeline (cube ratio、vector ratio、scalar ratio),提示latency bound:compute caused。
      • 若最大pipeline ratio的类型是memory pipeline(mte1 ratio、mte2 ratio、mte3 ratio),提示latency bound:memory caused。
搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词