下载
中文
注册

使用说明

计算算子(Computing Operator)

“分组方式”选择“计算算子”时显示该页面,可以看到单个计算算子维度的详情信息,以快速找到特定计算算子性能问题,如图1所示,“算子详情”中的字段解释如表1所示,单击字段后方的,可对相关字段进行模糊搜索。

图1 计算算子
表1 计算算子字段说明

中文字段

英文字段

说明

名称

Name

算子名称。

类型

Type

算子类型。

加速器核

Accelerator Core

AI加速核类型,包括AI Core、AI CPU等。

开始时间(ms)

Start Time(ms)

算子执行开始时间。

时长(μs)

Duration(μs)

当前算子执行耗时。

等待时间(μs)

Wait Time(μs)

算子执行等待时间。

Block数量

Block Dim

运行切分数量,对应任务执行时的核数。

输入Shapes

Input Shapes

算子输入Shape。

输入数据类型

Input Data Types

算子输入数据类型。

输入格式

Input Formats

算子输入数据格式。

输出Shapes

Output Shapes

算子输出Shape。

输出数据类型

Output Data Types

算子输出数据类型。

输出格式

Output Formats

算子输出数据格式。

计算算子类型(Computing Operator Type)

“分组方式”选择“计算算子类型”时显示该页面,可以看到不同计算算子类型算子的耗时占比和详细数据,以快速找到特定类型的计算算子性能问题,如图2所示,“算子详情”中的字段解释如表2所示,单击字段后方的,可对相关字段进行模糊搜索。

图2 计算算子类型
表2 计算算子类型字段说明

中文字段

英文字段

说明

类型

Type

算子类型。

加速器核

Accelerator Core

AI加速核类型,包括AI Core、AI CPU等。

数量

Count

算子执行次数。

总耗时(μs)

Total Time(μs)

算子执行总时间。

平均耗时(μs)

Avg Time(μs)

算子执行平均时间。

最大耗时(μs)

Max Time(μs)

算子执行的最大时间。

最小耗时(μs)

Min Time(μs)

算子执行的最小时间。

详情

Details

单击“详情”列中“查看更多”,可以展示单个计算算子的具体信息,详情请参见表1

计算算子名称和输入shape(Computing Operator Name and Input Shape)

“分组方式”选择“计算算子名称和输入shape”时显示该页面,可以看到不同算子类型的计算算子在特定输入Shape下的耗时占比和详细数据,以快速找到是否存在某个输入Shape下的算子性能问题,如图3所示,“算子详情”中的字段解释如表3所示,单击字段后方的,可对相关字段进行模糊搜索。

图3 计算算子名称和输入shape
表3 计算算子名称和输入shape字段说明

中文字段

英文字段

说明

名称

Name

算子名称。

Shape

Shape

算子输入Shape。

加速器核

Accelerator Core

AI加速核类型,包括AI Core、AI CPU等。

数量

Count

算子执行次数。

总耗时(μs)

Total Time(μs)

算子执行总时间。

平均耗时(μs)

Avg Time(μs)

算子执行平均时间。

最大耗时(μs)

Max Time(μs)

算子执行的最大时间。

最小耗时(μs)

Min Time(μs)

算子执行的最小时间。

详情

Details

单击“详情”列中“查看更多”,可以展示单个算子的具体信息,详情请参见表1

通信算子(HCCL Operator)

“分组方式”选择“通信算子”时显示该页面,可以看到单个通信算子维度的详情信息,以快速找到特定通信算子性能问题,如图4所示,“算子详情”中的字段解释如表4所示,单击字段后方的,可对相关字段进行模糊搜索。

图4 通信算子
表4 通信算子字段说明

中文字段

英文字段

说明

名称

Name

通信算子名称。

类型

Type

通信算子类型。

开始时间(ms)

Start Time(ms)

通信算子执行开始时间。

时长(μs)

Duration(μs)

当前通信算子执行耗时。

等待时间(μs)

Wait Time(μs)

通信算子执行等待时间。

通信算子类型(HCCL Operator Type)

“分组方式”选择“通信算子类型”时显示该页面,可以看到不同通信算子类型算子的耗时占比和详细数据,以快速找到特定类型的通信算子性能问题,如图5所示,“算子详情”中的字段解释如表5所示,单击字段后方的,可对相关字段进行模糊搜索。

图5 通信算子类型
表5 通信算子类型字段说明

中文字段

英文字段

说明

类型

Type

通信算子类型。

数量

Count

通信算子执行次数。

总耗时(μs)

Total Time(μs)

通信算子执行总时间。

平均耗时(μs)

Avg Time(μs)

通信算子执行平均时间。

最大耗时(μs)

Max Time(μs)

通信算子执行的最大时间。

最小耗时(μs)

Min Time(μs)

通信算子执行的最小时间。

详情

Details

单击“详情”列中“查看更多”,可以展示单个通信算子的具体信息,详情请参见表4

支持两卡间数据对比

MindStudio Insight支持卡间算子性能对比,可帮助开发者直观明了的查看两卡差异,便于分析,设置基线数据和对比数据的操作请参见数据对比

在卡间对比模式下,算子(Operator)界面不展示耗时百分比饼状图,只展示算子详情表,且“卡序号”是固定的,不能进行切换,“分组方式”可按需进行选择,还可配置展示TopN条数据。

算子详情表展示的是两卡间的差值,单击“详情”列中“查看更多”,可以展示基线数据和对比数据的详情,如图6所示,字段解释可分别参见各分组方式对应的字段解释,图中展示的是“分组方式”“计算算子类型”的数据对比详情。

图6 算子对比