使用说明
计算算子(Computing Operator)
当“分组方式”选择“计算算子”时显示该页面,可以看到单个计算算子维度的详情信息,以快速找到特定计算算子性能问题,如图1所示,“算子详情”中的字段解释如表1所示,单击字段后方的,可对相关字段进行模糊搜索。
中文字段 |
英文字段 |
说明 |
---|---|---|
名称 |
Name |
算子名称。 |
类型 |
Type |
算子类型。 |
加速器核 |
Accelerator Core |
AI加速核类型,包括AI Core、AI CPU等。 |
开始时间(ms) |
Start Time(ms) |
算子执行开始时间。 |
时长(μs) |
Duration(μs) |
当前算子执行耗时。 |
等待时间(μs) |
Wait Time(μs) |
算子执行等待时间。 |
Block数量 |
Block Dim |
运行切分数量,对应任务执行时的核数。 |
输入Shapes |
Input Shapes |
算子输入Shape。 |
输入数据类型 |
Input Data Types |
算子输入数据类型。 |
输入格式 |
Input Formats |
算子输入数据格式。 |
输出Shapes |
Output Shapes |
算子输出Shape。 |
输出数据类型 |
Output Data Types |
算子输出数据类型。 |
输出格式 |
Output Formats |
算子输出数据格式。 |
计算算子类型(Computing Operator Type)
当“分组方式”选择“计算算子类型”时显示该页面,可以看到不同计算算子类型算子的耗时占比和详细数据,以快速找到特定类型的计算算子性能问题,如图2所示,“算子详情”中的字段解释如表2所示,单击字段后方的,可对相关字段进行模糊搜索。
中文字段 |
英文字段 |
说明 |
---|---|---|
类型 |
Type |
算子类型。 |
加速器核 |
Accelerator Core |
AI加速核类型,包括AI Core、AI CPU等。 |
数量 |
Count |
算子执行次数。 |
总耗时(μs) |
Total Time(μs) |
算子执行总时间。 |
平均耗时(μs) |
Avg Time(μs) |
算子执行平均时间。 |
最大耗时(μs) |
Max Time(μs) |
算子执行的最大时间。 |
最小耗时(μs) |
Min Time(μs) |
算子执行的最小时间。 |
详情 |
Details |
单击“详情”列中“查看更多”,可以展示单个计算算子的具体信息,详情请参见表1。 |
计算算子名称和输入shape(Computing Operator Name and Input Shape)
当“分组方式”选择“计算算子名称和输入shape”时显示该页面,可以看到不同算子类型的计算算子在特定输入Shape下的耗时占比和详细数据,以快速找到是否存在某个输入Shape下的算子性能问题,如图3所示,“算子详情”中的字段解释如表3所示,单击字段后方的,可对相关字段进行模糊搜索。
中文字段 |
英文字段 |
说明 |
---|---|---|
名称 |
Name |
算子名称。 |
Shape |
Shape |
算子输入Shape。 |
加速器核 |
Accelerator Core |
AI加速核类型,包括AI Core、AI CPU等。 |
数量 |
Count |
算子执行次数。 |
总耗时(μs) |
Total Time(μs) |
算子执行总时间。 |
平均耗时(μs) |
Avg Time(μs) |
算子执行平均时间。 |
最大耗时(μs) |
Max Time(μs) |
算子执行的最大时间。 |
最小耗时(μs) |
Min Time(μs) |
算子执行的最小时间。 |
详情 |
Details |
单击“详情”列中“查看更多”,可以展示单个算子的具体信息,详情请参见表1。 |
通信算子(HCCL Operator)
当“分组方式”选择“通信算子”时显示该页面,可以看到单个通信算子维度的详情信息,以快速找到特定通信算子性能问题,如图4所示,“算子详情”中的字段解释如表4所示,单击字段后方的,可对相关字段进行模糊搜索。
通信算子类型(HCCL Operator Type)
当“分组方式”选择“通信算子类型”时显示该页面,可以看到不同通信算子类型算子的耗时占比和详细数据,以快速找到特定类型的通信算子性能问题,如图5所示,“算子详情”中的字段解释如表5所示,单击字段后方的,可对相关字段进行模糊搜索。
中文字段 |
英文字段 |
说明 |
---|---|---|
类型 |
Type |
通信算子类型。 |
数量 |
Count |
通信算子执行次数。 |
总耗时(μs) |
Total Time(μs) |
通信算子执行总时间。 |
平均耗时(μs) |
Avg Time(μs) |
通信算子执行平均时间。 |
最大耗时(μs) |
Max Time(μs) |
通信算子执行的最大时间。 |
最小耗时(μs) |
Min Time(μs) |
通信算子执行的最小时间。 |
详情 |
Details |
单击“详情”列中“查看更多”,可以展示单个通信算子的具体信息,详情请参见表4。 |