昇腾社区首页
中文
注册

通算流水图(MC2算子)

可使用msprof op对MC2算子进行调优,并生成mc2_trace.json和visualize_data.bin文件,将mc2_trace.json文件或visualize_data.bin文件导入MindStudio Insight后进行可视化呈现,能够直观看到MC2算子的通算运行情况、指令耗时等信息,协助开发者识别通算瓶颈。

  • 若要使用MindStudio Insight进行查看时,需要单独安装MindStudio Insight软件包,具体下载链接请参见MindStudio Insight 用户指南的“安装与卸载”章节
  • 将visualize_data.bin文件导入MindStudio Insight的具体操作请参考MindStudio Insight 用户指南的“算子调优 > 导入性能数据”章节。
  • MindStudio Insight具体操作和详细字段解释请参考MindStudio Insight 用户指南的“系统调优 > 时间线(Timeline)”章节。
  • Chrome浏览器

    在Chrome浏览器中输入“chrome://tracing”地址,并将通过msprof op生成指令流水图文件(mc2_trace.json拖到空白处打开,键盘上输入快捷键(W:放大,S:缩小,A:左移,D:右移)可进行查看。关键字段说明如表1

    表1 关键字段说明

    字段名

    字段功能

    AI CORE

    MC2算子在AI Core上的整体运行情况。

    AI CPU

    MC2算子在AI CPU上的整体运行情况。

    AIC BLOCK

    MC2算子在AI Core各cube核上的整体运行情况和HCCL接口调用情况。

    AIV BLOCK

    MC2算子在AI Core各vector核上的整体运行情况和HCCL接口调用情况。

    HCCL

    MC2算子在多卡间的集合通信流水。

    HCCL TASK

    MC2算子在多卡间的集合通信任务执行流水。

  • MindStudio Insight

    通过msprof op生成的trace.json文件或visualize_data.bin文件可导入MindStudio Insight进行可视化呈现。

    图1 通算流水图

    • 展示AI CPU和AI Core的耗时掩盖情况,用于评估MC2算子的性能。
    • 展示MC2算子在各BLOCK上的运行时间及接口流水,单击具体接口将会展示该接口的耗时及相关代码行细节。
    • 展示MC2算子在多卡间运行时的HCCL通信流水及HCCL通信任务流水。

      MC2算子支持对 Atlas A2 训练系列产品/Atlas 800I A2 推理产品 的AllReduce、AllGather、ReduceScatter、AlltoAll接口及的AllGather、ReduceScatter、AlltoAllV接口进行调用,具体介绍请参见Hccl中的“ 高阶API > Hccl > Hccl”章节。