Analysis Summary
- Analysis Summary:通过Merge Reports导入已采集的集群场景PROF_XXX的父目录来展示所有NPU节点通信耗时占比数据,如图1所示。
- Collection And Platform Info:通过选择需要查看的Device ID后,可以查看对应Device的详细硬件信息和Profiling采集信息,如图2所示。
Analysis Summary
字段 |
说明 |
---|---|
Analysis Summary |
分析汇总。 |
Bottlenecks And Profiling Suggestion |
瓶颈和Profiling分析建议。 |
The communication time ratio of all NPU cards exceeds the threshold of 10%. |
所有NPU节点通信时长占比均高于10%。 |
The communication time ratio of all NPU cards is good and below the threshold of 10%. |
所有NPU节点通信时长占比均低于10%。 |
The communication time ratio of some NPU cards exceeds the threshold of 10%. You need to check whether there are slow nodes or slow links. |
部分NPU节点通信时长占比高于10%。需要确认是否存在慢节点或者慢链路。 |
Click the Cluster Iteration Analysis tab to obtain more information. |
单击Cluster Iteration Analysis获取更多信息。 |
Top |
NPU节点通信时长占比的TopN。 |
Apply |
数据导出按钮。当选定Top值并单击该按钮时,导出TopN的NPU节点通信时长占比柱状图。 |
Ratio Of The NPU Card |
NPU节点通信时长占比图。 |
Ratio(%) |
NPU节点通信时长占比。 |
Rank * |
NPU节点在集群中对应的节点ID。 |
Profiling Info
字段 |
说明 |
---|---|
Result Size |
结果文件大小。 |
Profiling Elapsed Time |
信息采集持续的时间。 |
Host System Info
字段 |
说明 |
---|---|
Cpu Num |
CPU数量。 |
Host Operating System |
Host侧操作系统信息。 |
Host Computer Name |
Host侧电脑名称。 |
Host CPU Info
字段 |
说明 |
---|---|
CPU ID |
CPU ID。 |
Name |
CPU名称。 |
Type |
CPU型号。 |
Frequency |
CPU频率。 部分系统由于不存在调用频率的接口,故不展示此参数,本参数展示情况请以实际情况为准。 |
Logical CPU Count |
逻辑CPU数量。 |
Device Info
字段 |
说明 |
---|---|
AI Core Number |
AI Core 数量。 |
AI CPU Number |
AI CPU数量。 |
Control CPU Number |
Control CPU数量。 |
Control CPU Type |
Control CPU型号。 |
Device Id |
当前页面关联的Device ID。 |
TS CPU Number |
TS CPU数量。 |
DDR
字段 |
说明 |
---|---|
Metric |
BandWidth,单位为MB/s。 |
Read(MB/s) |
读带宽,单位为MB/s。 |
Write(MB/s) |
写带宽,单位为MB/s。 |
AI Core Utilization
AI Core利用率通过折线图方式呈现(AI Core Utilization参数选择Sample-based才会展示)。