下载
中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助
昇腾小AI

ArithmeticUtilization(cube及vector类型指令耗时和占比)

cube及vector类型指令的cycle占比数据ArithmeticUtilization.csv,建议优化算子逻辑,减少冗余计算指令。

示例仅展示部分参数,详情介绍请参见下表中的字段说明。

Atlas A2训练系列产品/Atlas 800I A2推理产品

图1 ArithmeticUtilization.csv文件
关键字段说明如下。
表1 字段说明

字段名

字段解释

block_id

Task运行切分数量,对应Task运行时配置的核数。

sub_block_id

Task运行使用的每个block名称和序号。

aic_time(us)

该Task被分配到每个AI Core计算单元上后,每个AI Core计算单元上的执行时间,单位us。

aic_total_cycles

该Task被分配到每个AI Core计算单元上后,每个AI Core计算单元上的执行的cycle总数。

aiv_time(us)

该Task被分配到每个AI Vector Core计算单元上后,每个AI Vector Core计算单元上的执行时间,单位us。

aiv_total_cycles

该Task被分配到每个AI Vector Core计算单元上后,每个AI Vector Core计算单元上的执行的cycle总数。

此处ArithmeticUtilization性能指标采集项的更多参数解析参见Atlas A2训练系列产品/Atlas 800I A2推理产品

Atlas 推理系列产品(Ascend 310P处理器)

图2 ArithmeticUtilization.csv文件()
关键字段说明如下。
表2 字段说明

字段名

字段解释

aic_time(us)

该Task被分配到每个AI Core计算单元上后,每个AI Core计算单元上的执行时间,单位us。

aic_total_cycles

该Task被分配到每个AI Core计算单元上后,每个AI Core计算单元上的执行的cycle总数。

此处ArithmeticUtilization性能指标采集项的更多参数解析参见11.10.11-Atlas 推理系列产品(As...

搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词