下载
中文
注册

导入性能数据

概述

MindStudio Insight支持导入性能数据文件,并以图形化形式呈现相关内容。性能数据文件的采集方式请分别参见性能调优工具指南文档中的性能分析(PyTorch训练/在线推理)性能分析(TensorFlow训练/在线推理)msprof采集通用命令章节内容,以及《MindSpore Insight》中的“性能调试(Ascend)”章节内容。

性能数据分为单卡场景和集群场景,具体请参见表1,数据导入操作请参见导入数据章节进行导入。

表1 性能数据场景说明

场景

说明

单卡场景

可在MindStudio Insight工具中导入单卡进行分析。

当导入单卡场景数据时,MindStudio Insight工具支持显示时间线(Timeline)、内存(Memory)和算子(Operator)界面,具体内容请参见单卡场景

集群场景

也称多卡场景,由多个单卡组成的集群数据,具体内容请参见集群场景

单卡场景

在单卡场景下,性能数据可分为三大类型,如下所示:

  • PyTorch训练/推理数据:支持导入以“ascend_pt”结尾的性能数据目录,性能数据文件详情请分别参见表2表3
    表2 PyTorch训练/推理性能数据文件(TEXT)

    文件名

    说明

    展示界面

    trace_view.json

    包括应用层数据、CANN层数据和底层NPU数据。

    时间线(Timeline)

    msprof_*.json

    timeline数据总表。如果存在变频数据(AI Core Freq)信息,会展示AI Core Freq层级。

    时间线(Timeline)

    operator_details.csv

    统计PyTorch算子在Host侧(下发)和Device侧(执行)的耗时。

    时间线(Timeline)

    memory_record.csv

    进程级内存申请情况信息。

    内存(Memory)

    operator_memory.csv

    算子内存申请情况信息。

    内存(Memory)

    kernel_details.csv

    NPU上执行的所有算子的信息。

    算子(Operator)

    step_trace_time.csv

    迭代中计算和通信的时间统计。

    概览(Summary)

    communication.json

    通信算子通信耗时、带宽等详细信息文件。

    通信(Communication)

    communication_matrix.json

    通信小算子基本信息文件。

    通信(Communication)

    注:“*”表示{timestamp}时间戳。

    表3 PyTorch训练/推理性能数据文件(DB)

    文件名

    说明

    展示界面

    ascend_pytorch_profiler_{rank_id}.db

    Ascend PyTorch Profiler接口采集的性能数据文件(DB格式)。

    时间线(Timeline)

    内存(Memory)

    算子(Operator)

    概览(Summary)

    通信(Communication)

    analysis.db

    多卡或集群等存在通信的场景下,采集到的DB格式的数据文件。

    • 表2中memory_record.csv和operator_memory.csv两个文件必须同时存在且保证在同一目录,导入成功后内存(Memory)页签才能正常展示。
    • 支持导入算子打点数据文件,获取文件方式请参见性能调优工具指南文档中“其他采集方式介绍 > 使用PyTorch框架接口采集 > Ascend PyTorch Profiler接口采集章节“msprof_tx”相关内容,导入成功后会在时间线(Timeline)界面展示打点数据。
  • MindSpore训练/推理数据:支持导入MindSpore框架性能数据,获取方式请参见《MindSpore Insight》中的“性能调试(Ascend)”章节。

    MindStudio Insight工具支持导入以“ascend_ms”结尾的性能数据目录,当用户获取到MindSpore框架性能数据后,需自行创建一个空文件夹,将名为“rank-{卡序号}_{时间戳}_ascend_ms”的文件夹汇总拷贝至新建的文件夹,将新建文件夹作为性能数据目录导入至MindStudio Insight工具。MindSpore框架性能数据导入成功后,MindStudio Insight工具会显示时间线(Timeline)、内存(Memory)、概览(Summary)和通信(Communication)界面。

  • 离线推理数据:支持导入mindstudio_profiler_output目录下性能数据,性能数据文件详情请分别参见表4表5
    表4 离线推理性能数据文件(TEXT)

    文件名

    说明

    展示界面

    msprof_*.json

    timeline数据总表。

    时间线(Timeline)

    fusion_op_*.csv

    模型中算子融合前后信息。单算子场景下无此性能数据文件。

    时间线(Timeline)

    api_statistic_*.csv

    用于统计CANN层的API执行耗时信息。

    时间线(Timeline)

    memory_record_*.csv

    进程级内存申请情况信息。

    内存(Memory)

    operator_memory_*.csv

    算子内存申请情况信息。

    内存(Memory)

    op_summary_*.csv

    AI Core和AI CPU算子数据。

    算子(Operator)

    op_statistic _*.csv

    AI Core和AI CPU算子调用次数及耗时统计。

    算子(Operator)

    prof_rule_0_*.json

    调优建议。

    时间线(Timeline)

    概览(Summary)

    通信(Communication)

    step_trace_*.csv

    迭代轨迹数据。单算子场景下无此性能数据文件。

    -

    step_trace_*.json

    迭代轨迹数据,每轮迭代的耗时。单算子场景下无此性能数据文件。

    -

    task_time_*.csv

    Task Scheduler任务调度信息。

    -

    注:“*”表示{timestamp}时间戳。

    表5 离线推理性能数据文件(DB)

    文件名

    说明

    展示界面

    msprof_*.db

    统一DB文件。当前该格式数据与TEXT参数解析的数据信息量存在差异。

    时间线(Timeline)

    内存(Memory)

    算子(Operator)

    概览(Summary)

    通信(Communication)

    注:“*”表示{timestamp}时间戳。

    • 表4中memory_record.csv和operator_memory.csv两个文件必须同时存在且保证在同一目录,导入成功后内存(Memory)界面才能正常展示。
    • 对于未完成性能数据解析的PROF_XXX目录,需要先使用msprof命令行的export功能解析并导出性能数据文件后才可以使用MindStudio Insight工具展示,数据使用msprof命令行解析并导出的操作请参见性能调优工具指南文档中“msprof命令行工具 > 性能数据解析与导出(msprof命令)章节。

集群场景

集群场景也称多卡场景,由多个单卡组成的集群数据,可导入profiling全部原始数据。导入成功后,显示时间线(Timeline)、内存(Memory)、算子(Operator)、概览(Summary)、通信(Communication)界面。