文档
注册

AI Core Metrics视图

单击下方数据窗格的AI Core Metrics,可以查看AI Core Metrics数据。

图1 AI Core Metrics
表1 字段说明

字段名

字段解释

Task-based:Pipeline Utilization

Task ID

Task ID,用于识别task。

Stream ID

Stream ID,用于识别stream。

Op Name

算子名称,用于识别算子。

OP Type

算子类型。

Task Start Time

任务启动时间。

Task Duration(us)

任务运行持续时间,单位为us。

Task Wait Time(us)

任务等待时间,单位为us。

Aicore Time(us)

AI Core运行时间,单位为us。

Total Cycles

该Task的所有指令的cycle总数。

Vec Time(us)

vec类型指令(向量类运算指令)耗时,单位为us。

Vec Ratio

vector类型指令(向量类运算指令)的cycle数在所有指令的cycle数中的占用比。

Mac Time(us)

cube类型指令(矩阵类运算指令)耗时,单位为us。

Mac Ratio

cube类型指令(矩阵类运算指令)的cycle数在所有指令的cycle数中的占用比。

Scalar Time(us)

scalar类型指令(标量类运算指令)耗时,单位为us。

Scalar Ratio

scalar类型指令(标量类运算指令)的cycle数在所有指令 的cycle数中的占用比。

Mte1 Time(us)

mte1类型指令(L1->L0A/L0B搬运类指令)耗时,单位为us。

Mte1 Ratio

mte1类型指令(L1->L0A/L0B搬运类指令)的cycle数在所 有指令的cycle数中的占用比。

Mte2 Time(us)

mte2类型指令(DDR->AI Core搬运类指令)耗时,单位为us。

Mte2 Ratio

mte2类型指令(DDR->AI Core搬运类指令)的cycle数在 所有指令的cycle数中的占用比。

Mte3 Time(us)

mte3类型指令(AI Core->DDR搬运类指令)耗时,单位为us。

Mte3 Ratio

mte3类型指令(AI Core->DDR搬运类指令)的cycle数在 所有指令的cycle数中的占用比。

Icache Miss Rate

icache缺失率,即未命中icache,数值越小越好。

Memory Bound

用于识别AI Core执行算子计算过程是否存在Memory瓶颈,由Mte2 Ratio/max(Mac Ratio, Vec Ratio)计算得出。计算结果小于1,表示没有Memory瓶颈;计算结果大于1则表示有Memory瓶颈,且数值越大越瓶颈严重。

Task-based:Arithmetic Utilization

Task ID

Task ID,用于识别task。

Stream ID

Stream ID,用于识别stream。

Op Name

算子名称,用于识别算子。

OP Type

算子类型。

Task Start Time

任务启动时间。

Task Duration(us)

任务运行持续时间,单位为us。

Task Wait Time(us)

任务等待时间,单位为us。

Aicore Time(us)

AI Core运行时间,单位为us。

Total Cycles

该Task的所有指令的cycle总数。

Mac Fp16 Ratio

cube fp16类型指令的cycle数在所有指令的cycle数中的占用比。

Mac Int8 Ratio

cube int8类型指令的cycle数在所有指令的cycle数中的占用比。

Vec Fp32 Ratio

vec fp32类型指令的cycle数在所有指令的cycle数中的占用比。

Vec Fp16 Ratio

vec fp16类型指令的cycle数在所有指令的cycle数中的占用比。

Vec Int32 Ratio

vec int32类型指令的cycle数在所有指令的cycle数中的占用比。

Vec Misc Ratio

vec misc类型指令的cycle数在所有指令的cycle数中的占用比。

Cube Fops

cube类型的浮点运算数,即计算量,可用于衡量算法/模型的复杂度,其中Fops表示floating point operations,缩写为FLOPs。

Vector Fops

vector类型浮点运算数,即计算量,可用于衡量算法/模型的复杂度,其中Fops表示floating point operations,缩写为FLOPs。

Task-based:UB/L1/L2/Main Memory Bandwidth

Task ID

Task ID,用于识别task。

Stream ID

Stream ID,用于识别stream。

Op Name

算子名称,用于识别算子。

OP Type

算子类型。

Task Start Time

任务启动时间。

Task Duration(us)

任务运行持续时间,单位为us。

Task Wait Time(us)

任务等待时间,单位为us。

Aicore Time(us)

AI Core运行时间,单位为us。

Total Cycles

该Task的所有指令的cycle总数。

ub_read_bw(GB/s)

Ub读带宽速率,单位为GB/s。

ub_write_bw(GB/s)

Ub写带宽速率,单位为GB/s。

l1_read_bw(GB/s)

L1读带宽速率,单位为GB/s。

l1_write_bw(GB/s)

L1写带宽速率,单位为GB/s。

l2_read_bw(GB/s)

L2读带宽速率,单位为GB/s。

l2_write_bw(GB/s)

L2写带宽速率,单位为GB/s。

main_mem_read_bw(GB/s)

主存储器读带宽速率,单位为GB/s。

main_mem_write_bw(GB/s)

主存储器写带宽速率,单位为GB/s。

Task-based:L0A/L0B/L0C Memory Bandwidth

Task ID

Task ID,用于识别task。

Stream ID

Stream ID,用于识别stream。

Op Name

算子名称,用于识别算子。

OP Type

算子类型。

Task Start Time

任务启动时间。

Task Duration(us)

任务运行持续时间,单位为us。

Task Wait Time(us)

任务等待时间,单位为us。

Aicore Time(us)

AI Core运行时间,单位为us。

Total Cycles

该Task的所有指令的cycle总数。

scalar_ld_ratio

scalar access ub类型读指令的cycle数在所有指令的cycle数中的占用比。

scalar_st_ratio

scalar access ub类型写指令的cycle数在所有指令的cycle数中的占用比。

l0a_read_bw(GB/s)

L0a读带宽速率,单位为GB/s。

l0a_write_bw(GB/s)

L0a写带宽速率,单位为GB/s。

l0b_read_bw(GB/s)

L0b读带宽速率,单位为GB/s。

l0b_write_bw(GB/s)

L0b写带宽速率,单位为GB/s。

l0c_read_bw(GB/s)

vector从l0c读带宽速率,单位为GB/s。

l0c_write_bw(GB/s)

vector向l0c写带宽速率,单位为GB/s。

l0c_read_bw_cube(GB/s)

cube从l0c读带宽速率,单位为GB/s。

l0c_write_bw_cube(GB/s)

cube向l0c写带宽速率,单位GB/s。

Task-based:UB Memory Bandwidth

Task ID

Task ID,用于识别task。

Stream ID

Stream ID,用于识别stream。

Op Name

算子名称,用于识别算子。

OP Type

算子类型。

Task Start Time

任务启动时间。

Task Duration(us)

任务运行持续时间,单位为us。

Task Wait Time(us)

任务等待时间,单位为us。

Aicore Time(us)

AI Core运行时间,单位为us。

Total Cycles

该Task的所有指令的cycle总数。

ub_read_bw_mte(GB/s)

mte从ub读带宽速率,单位为GB/s。昇腾310 AI处理器支持。

ub_write_bw_mte(GB/s)

mte向ub写带宽速率,单位为GB/s。昇腾310 AI处理器支持。

ub_read_bw_vector(GB/s)

vector从ub读带宽速率,单位为GB/s。

ub_write_bw_vector(GB/s)

vector向ub写带宽速率,单位为GB/s。

ub_read_bw_scalar(GB/s)

scalar从ub读带宽速率,单位为GB/s。

ub_write_bw_scalar(GB/s)

scalar向ub写带宽速率,单位为GB/s。

Sample-based:Pipeline Utilization

Core ID

AI Core ID,用于识别AI Core。

Vec Ratio

vector类型指令(向量类运算指令)的cycle数在所有指令的cycle数中的占用比。

Mac Ratio

cube类型指令(矩阵类运算指令)的cycle数在所有指令的cycle数中的占用比。

Scalar Ratio

scalar类型指令(标量类运算指令)的cycle数在所有指令的cycle数中的占用比。

Mte1 Ratio

mte1类型指令(L1->L0A/L0B搬运类指令)的cycle数在所有指令的cycle数中的占用比。

Mte2 Ratio

mte2类型指令(DDR->AI Core搬运类指令)的cycle数在所有指令的cycle数中的占用比。

Mte3 Ratio

mte3类型指令(AI Core->DDR搬运类指令)的cycle数在所有指令的cycle数中的占用比。

Icache Miss Rate

icache缺失率,即未命中icache,数值越小越好。

Memory Bound

用于识别AI Core执行算子计算过程是否存在内存瓶颈,由mte2_ratio/max(mac_ratio, vec_ratio)计算得出。计算结果小于1表示没有内存瓶颈;计算结果大于1表示有内存瓶颈,且数值越大瓶颈越严重。

Sample-based:Arithmetic Utilization

Core ID

AI Core ID,用于识别AI Core。

Mac Fp16_ratio

cube fp16类型指令的cycle数在所有指令的cycle数中的占用比。

Mac Int8 Ratio

cube int8类型指令的cycle数在所有指令的cycle数中的占用比。

Vec Fp32 Ratio

vec fp32类型指令的cycle数在所有指令的cycle数中的占用比。

Vec Fp16 Ratio

vec fp16类型指令的cycle数在所有指令的cycle数中的占用比。

Vec Int32 Ratio

vec int32类型指令的cycle数在所有指令的cycle数中的占用比。

Vec Misc Ratio

vec misc类型指令的cycle数在所有指令的cycle数中的占用比。

Cube Fops

Cube类型每秒浮点运算次数。

Vector Fops

Vector类型每秒浮点运算次数。

Sample-based:UB/L1/L2/Main Memory Bandwidth

Core ID

AI Core ID,用于识别AI Core。

ub_read_bw(GB/s)

Ub读带宽速率,单位为GB/s。

ub_write_bw(GB/s)

Ub写带宽速率,单位为GB/s。

l1_read_bw(GB/s)

L1读带宽速率,单位为GB/s。

l1_write_bw(GB/s)

L1写带宽速率,单位为GB/s。

l2_read_bw(GB/s)

L2读带宽速率,单位为GB/s。

l2_write_bw(GB/s)

L2写带宽速率,单位为GB/s。

main_mem_read_bw(GB/s)

主存储器读带宽速率,单位为GB/s。

main_mem_write_bw(GB/s)

主存储器写带宽速率,单位为GB/s。

Sample-based:L0A/L0B/L0C Memory Bandwidth

Core ID

AI Core ID,用于识别AI Core。

l0a_read_bw(GB/s)

L0a读带宽速率,单位为GB/s。

l0a_write_bw(GB/s)

L0a写带宽速率,单位为GB/s。

l0b_read_bw(GB/s)

L0b读带宽速率,单位为GB/s。

l0b_write_bw(GB/s)

L0b写带宽速率,单位为GB/s。

l0c_read_bw(GB/s)

vector从l0c读带宽速率,单位为GB/s。

l0c_write_bw(GB/s)

vector向l0c写带宽速率,单位为GB/s。

l0c_read_bw_cube(GB/s)

cube从l0c读带宽速率,单位为GB/s。

l0c_write_bw_cube(GB/s)

cube向l0c写带宽速率,单位GB/s。

Sample-based:UB Memory Bandwidth

Core ID

AI Core ID,用于识别AI Core。

ub_read_bw_vector(GB/s)

vector从ub读带宽速率,单位为GB/s。

ub_write_bw_vector(GB/s)

vector向ub写带宽速率,单位为GB/s。

ub_read_bw_scalar(GB/s)

scalar从ub读带宽速率,单位为GB/s。

ub_write_bw_scalar(GB/s)

scalar向ub写带宽速率,单位为GB/s。

ub_read_bw_mte(GB/s)

mte从ub读带宽速率,单位为GB/s。昇腾310 AI处理器支持。

ub_write_bw_mte(GB/s)

mte向ub写带宽速率,单位为GB/s。昇腾310 AI处理器支持。

搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词