界面介绍
功能说明
算子(Operator)视图旨在通过分析计算算子和通信算子耗时数据帮助开发者快速分析性能瓶颈。
界面展示
算子(Operator)界面由参数配置栏(区域一)、耗时百分比饼状图(区域二)、耗时统计及详情数据表(区域三)三个部分组成,如图1所示。
- 区域一:参数配置栏,参数详细说明如表1所示。
表1 参数配置 中文参数
英文参数
说明
分组方式
Group by
- 计算算子(Computing Operator):展示所有计算算子的详细信息,帮助开发者找到耗时较大的计算算子。
- 计算算子类型(Computing Operator Type):统计相同类型的计算算子,计算其总耗时、最大耗时及平均耗时等信息,并支持查看特定类型下的计算算子详情信息,帮助开发者快速识别特定类型计算算子性能瓶颈,如AI CPU算子等。
- 计算算子名称和输入shape(Computing Operator Name and Input Shape):统计相同类型和Input Shape的算子,计算其总耗时、最大耗时及平均耗时等信息,并支持查看特定类型下的算子详情信息,帮助开发者快速识别某类型算子在特性Input下的性能瓶颈。
- 通信算子(HCCL Operator):展示所有通信算子的详细信息,帮助开发者找到耗时较大的通信算子。
- 通信算子类型(HCCL Operator Type):统计相同类型的通信算子,计算其总耗时、最大耗时及平均耗时等信息,并支持查看特定类型下的通信算子详情信息,帮助开发者快速识别特定类型通信算子性能瓶颈。
机器名称
Host Name
仅当导入的DB文件中存在名称为“HOST_INFO”的表时,存在该选项。
卡序号
Rank ID
支持按单卡维度展示算子性能数据。
前
Top
可通过配置Top参数值选择展示总耗时最长的TopN条数据,默认值为15;选择自定义(Custom)时,可以自定义数据条数。
- 区域二:耗时百分比饼状图。
- 当“分组方式”选择“计算算子”、“计算算子类型”或“计算算子名称和输入shape”时,页面会显示2个饼状图,左边展示不同计算算子类型耗时的占比,此视图受区域一中前(Top)配置影响,只显示Top N或全部计算算子或计算算子类型的占比;右边展示的为Top N或全部计算算子/计算算子类型按加速核耗时占比情况,如AI Core、AI CPU等。
- 当“分组方式”选择“通信算子”或“通信算子类型”时,页面显示1个饼状图,展示不同通信算子类型耗时的占比,视图受区域一中前(Top)配置影响,只显示Top N或全部通信算子或通信算子类型的占比。
- 区域三:耗时统计及详情数据表,展示算子统计信息或者详细信息数据,并可以通过单击“查看更多”进一步查看详细信息。
父主题: 算子(Operator)