biu_group/aic_core_group/aiv_core_group(AI Core和AI Vector的带宽和延时)
AI Core和AI Vector的带宽和延时数据无summary信息,timeline信息在msprof_*.json文件的biu_group、aic_core_group、aiv_core_group层级展示。
支持的型号
Atlas A2训练系列产品/Atlas 800I A2推理产品
msprof*.json文件的biu_group、aic_core_group、aiv_core_group层级数据说明
图1 biu_group

图2 aic_core_group

图3 aiv_core_group

字段名 |
字段含义 |
---|---|
Bandwidth Read |
BIU单元读取指令时的带宽。 |
Bandwidth Write |
BIU单元写入指令时的带宽。 |
Latency Read |
BIU单元读取指令时的时延。 |
Latency Write |
BIU单元写入指令时的时延。 |
Cube |
矩阵类运算指令在本采样周期内的cycle数和占比。 |
Mte1 |
L1->L0A/L0B搬运类指令在本采样周期内的cycle数和占比。 |
Mte2 |
片上内存->AICORE搬运类指令在本采样周期内的cycle数和占比。 |
Mte3 |
AICORE->片上内存搬运类指令在本采样周期内的cycle数和占比。 |
Mte0 |
L1->L0A/L0B搬运类指令在本采样周期内的cycle数和占比。 |
Mte1 |
片上内存->AICORE搬运类指令在本采样周期内的cycle数和占比。 |
Mte2 |
AICORE->片上内存搬运类指令在本采样周期内的cycle数和占比。 |
Scalar |
标量类运算指令在本采样周期内的cycle数和占比。 |
Vector |
向量类运算指令在本采样周期内的cycle数和占比。 |
父主题: 性能数据文件参考