ProfilingAicoreMetrics
1 2 3 4 5 6 7 8 9 10 11 |
enum ProfilingAicoreMetrics { kAicoreArithmeticUtilization = 0, // 各种计算类指标占比统计,包括采集项mac_fp16_ratio、mac_int8_ratio、vec_fp32_ratio、vec_fp16_ratio、vec_int32_ratio、vec_misc_ratio kAicorePipeUtilization = 1, // 计算单元和搬运单元耗时占比,包括采集项vec_ratio、mac_ratio、scalar_ratio、mte1_ratio、mte2_ratio、mte3_ratio、icache_miss_rate、fixpipe_ratio(Atlas A2训练系列产品/Atlas 800I A2推理产品) kAicoreMemory = 2, // 外部内存读写类指令占比,包括采集项ub_read_bw、ub_write_bw、l1_read_bw、l1_write_bw、main_mem_read_bw、main_mem_write_bw kAicoreMemoryL0 = 3, // 内部内存读写类指令占比,包括采集项scalar_ld_ratio、scalar_st_ratio、l0a_read_bw、l0a_write_bw、l0b_read_bw、l0b_write_bw、l0c_read_bw、l0c_write_bw、l0c_read_bw_cube、l0c_write_bw_cube kAicoreResourceConflictRatio = 4, // 流水线队列类指令占比,包括采集项vec_bankgroup_cflt_ratio、vec_bank_cflt_ratio、vec_resc_cflt_ratio、mte1_iq_full_ratio、mte2_iq_full_ratio、mte3_iq_full_ratio、cube_iq_full_ratio、vec_iq_full_ratio、iq_full_ratio kAicoreMemoryUB = 5, //内部内存读写指令占比,包括采集项ub_read_bw_vector、ub_write_bw_vector、ub_read_bw_scalar、ub_write_bw_scalar kAicoreL2Cache = 6, //(Atlas A2训练系列产品/Atlas 800I A2推理产品)读写cache命中次数和缺失后重新分配次数, 包括采集项ai*_write_cache_hit、ai*_write_cache_miss_allocate、ai*_r*_read_cache_hit、ai*_r*_read_cache_miss_allocate kAicoreL2Cache = 6, //(Atlas 200I/500 A2推理产品)读写cache命中次数和缺失后重新分配次数, 包括采集项write_cache_hit、write_cache_miss_allocate、r*_read_cache_hit、r*_read_cache_miss_allocate kAicorePipelineExecuteUtilization = 7, //(Atlas 200I/500 A2推理产品)计算单元和搬运单元耗时占比,包括采集项vec_exe_ratio、mac_exe_ratio、scalar_exe_ratio、mte1_exe_ratio、mte2_exe_ratio、mte3_exe_ratio、fixpipe_exe_ratio }; |
父主题: 数据类型