MemoryUB(UB读写带宽速率)
mte/vector/scalar采集ub读写带宽速率数据MemoryUB.csv。示例仅展示部分参数,详情介绍请参见下表中的字段说明。
Atlas A2训练系列产品/Atlas 800I A2推理产品
关键字段说明如下。
字段名 |
字段解释 |
---|---|
block_id |
Task运行切分数量,对应Task运行时配置的核数。 |
sub_block_id |
Task运行使用的每个block名称和序号。 |
aic_time(us) |
该Task被分配到每个AI Core计算单元上后,每个AI Core计算单元上的执行时间,单位us。 |
aic_total_cycles |
该Task被分配到每个AI Core计算单元上后,每个AI Core计算单元上的执行的cycle总数。 |
aiv_time(us) |
该Task被分配到每个AI Vector Core计算单元上后,每个AI Vector Core计算单元上的执行时间,单位us。 |
aiv_total_cycles |
该Task被分配到每个AI Vector Core计算单元上后,每个AI Vector Core计算单元上的执行的cycle总数。 |
aiv_ub_read_bw_vector(GB/s) |
代表vector从ub读带宽速率,单位GB/s。 |
aiv_ub_write_bw_vector(GB/s) |
代表vector向ub写带宽速率,单位GB/s。 |
aiv_ub_read_bw_scalar(GB/s) |
代表scalar从ub读带宽速率,单位GB/s。 |
aiv_ub_write_bw_scalar(GB/s) |
代表scalar向ub写带宽速率,单位GB/s。 |
Atlas 推理系列产品
关键字段说明如下。
字段名 |
字段解释 |
---|---|
aic_time(us) |
该Task被分配到每个AI Core计算单元上后,每个AI Core计算单元上的执行时间,单位us。 |
aic_total_cycles |
该Task被分配到每个AI Core计算单元上后,每个AI Core计算单元上的执行的cycle总数。 |
aic_ub_read_bw_vector(GB/s) |
代表vector从ub读带宽速率,单位GB/s。 |
aic_ub_write_bw_vector(GB/s) |
代表vector向ub写带宽速率,单位GB/s。 |
aic_ub_read_bw_scalar(GB/s) |
代表scalar从ub读带宽速率,单位GB/s。 |
aic_ub_write_bw_scalar(GB/s) |
代表scalar向ub写带宽速率,单位GB/s。 |