文档
注册

Analysis Summary

Analysis Summary界面分为Analysis Summary和Collection And Platform Info两部分。
  • Analysis Summary:通过Merge Reports导入已采集的集群场景PROF_XXX的父目录来展示所有NPU节点通信耗时占比数据,如图1所示。
  • Collection And Platform Info:通过选择需要查看的Device ID后,可以查看对应Device的详细硬件信息和Profiling采集信息,如图2所示。
图1 Analysis Summary
图2 Collection And Platform Info

Analysis Summary

表1 分析总结

字段

说明

Analysis Summary

分析汇总。

Bottlenecks And Profiling Suggestion

瓶颈和Profiling分析建议。

The communication time ratio of all NPU cards exceeds the threshold of 10%.

所有NPU节点通信时长占比均高于10%。

The communication time ratio of all NPU cards is good and below the threshold of 10%.

所有NPU节点通信时长占比均低于10%。

The communication time ratio of some NPU cards exceeds the threshold of 10%. You need to check whether there are slow nodes or slow links.

部分NPU节点通信时长占比高于10%。需要确认是否存在慢节点或者慢链路。

Click the Cluster Iteration Analysis tab to obtain more information.

单击Cluster Iteration Analysis获取更多信息。

Top

NPU节点通信时长占比的TopN。

Apply

数据导出按钮。当选定Top值并单击该按钮时,导出TopN的NPU节点通信时长占比柱状图。

Ratio Of The NPU Card

NPU节点通信时长占比图。

Ratio(%)

NPU节点通信时长占比。

Rank *

NPU节点在集群中对应的节点ID。

Profiling Info

表2 收集信息

字段

说明

Result Size

结果文件大小。

Profiling Elapsed Time

信息采集持续的时间。

Host System Info

表3 Host系统信息

字段

说明

Cpu Num

CPU数量。

Host Operating System

Host侧操作系统信息。

Host Computer Name

Host侧电脑名称。

Host CPU Info

表4 Host侧CPU信息

字段

说明

CPU ID

CPU ID。

Name

CPU名称。

Type

CPU型号。

Frequency

CPU频率。

部分系统由于不存在调用频率的接口,故不展示此参数,本参数展示情况请以实际情况为准。

Logical CPU Count

逻辑CPU数量。

Device Info

表5 Device信息

字段

说明

AI Core Number

AI Core 数量。

AI CPU Number

AI CPU数量。

Control CPU Number

Control CPU数量。

Control CPU Type

Control CPU型号。

Device Id

当前页面关联的Device ID。

TS CPU Number

TS CPU数量。

DDR

表6 DDR参数说明

字段

说明

Metric

BandWidth,单位为MB/s。

Read(MB/s)

读带宽,单位为MB/s。

Write(MB/s)

写带宽,单位为MB/s。

AI Core Utilization

AI Core利用率通过折线图方式呈现(AI Core Utilization参数选择Sample-based才会展示)。

搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词