PipeUtilization(计算单元和搬运单元耗时占比)
采集计算单元和搬运单元耗时和占比数据PipeUtilization.csv。建议优化数据搬运逻辑,提高带宽利用率。
Atlas A2训练系列产品/Atlas 800I A2推理产品
图1 PipeUtilization.csv文件
关键字段说明如下。
字段名 |
字段解释 |
---|---|
block_id |
Task运行切分数量,对应Task运行时配置的核数。 |
sub_block_id |
Task运行使用的每个block名称和序号。 |
aic_time(us) |
该Task被分配到每个AI Core计算单元上后,每个AI Core计算单元上的执行时间,单位us。 |
aic_total_cycles |
该Task被分配到每个AI Core计算单元上后,每个AI Core计算单元上的执行的cycle总数。 |
aiv_time(us) |
该Task被分配到每个AI Vector Core计算单元上后,每个AI Vector Core计算单元上的执行时间,单位us。 |
aiv_total_cycles |
该Task被分配到每个AI Vector Core计算单元上后,每个AI Vector Core计算单元上的执行的cycle总数。 |
此处PipeUtilization性能指标采集项的更多参数解析参见Atlas A2训练系列产品/Atlas 800...。 |
Atlas 推理系列产品
图2 PipeUtilization.csv文件
关键字段说明如下。
字段名 |
字段解释 |
---|---|
aic_time(us) |
该Task被分配到每个AI Core计算单元上后,每个AI Core计算单元上的执行时间,单位us。 |
aic_total_cycles |
该Task被分配到每个AI Core计算单元上后,每个AI Core计算单元上的执行的cycle总数。 |
此处PipeUtilization性能指标采集项的更多参数解析参见Atlas 推理系列产品。 |
父主题: msprof op