ArithmeticUtilization(cube及vector类型指令耗时和占比)
cube及vector类型指令的cycle占比数据ArithmeticUtilization.csv,建议优化算子逻辑,减少冗余计算指令。
示例仅展示部分参数,详情介绍请参见下表中的字段说明。
Atlas A2训练系列产品/Atlas 800I A2推理产品
图1 ArithmeticUtilization.csv文件
关键字段说明如下。
字段名 |
字段解释 |
---|---|
block_id |
Task运行切分数量,对应Task运行时配置的核数。 |
sub_block_id |
Task运行使用的每个block名称和序号。 |
aic_time(us) |
该Task被分配到每个AI Core计算单元上后,每个AI Core计算单元上的执行时间,单位us。 |
aic_total_cycles |
该Task被分配到每个AI Core计算单元上后,每个AI Core计算单元上的执行的cycle总数。 |
aiv_time(us) |
该Task被分配到每个AI Vector Core计算单元上后,每个AI Vector Core计算单元上的执行时间,单位us。 |
aiv_total_cycles |
该Task被分配到每个AI Vector Core计算单元上后,每个AI Vector Core计算单元上的执行的cycle总数。 |
此处ArithmeticUtilization性能指标采集项的更多参数解析参见Atlas A2训练系列产品/Atlas 800I A2推理产品。 |
Atlas 推理系列产品(Ascend 310P处理器)
图2 ArithmeticUtilization.csv文件()
关键字段说明如下。
字段名 |
字段解释 |
---|---|
aic_time(us) |
该Task被分配到每个AI Core计算单元上后,每个AI Core计算单元上的执行时间,单位us。 |
aic_total_cycles |
该Task被分配到每个AI Core计算单元上后,每个AI Core计算单元上的执行的cycle总数。 |
此处ArithmeticUtilization性能指标采集项的更多参数解析参见11.10.11-Atlas 推理系列产品(As...。 |
父主题: msProf性能数据文件