数据采集

当前集群分析工具主要支持Ascend Pytorch Profiler采集方式下的集群数据。

采集分析的数据要求是L1级别的数据。当前L0级别也支持,但不支持详细的通信带宽分析。

experimental_config = torch_npu.profiler._ExperimentalConfig(
    profiler_level=torch_npu.profiler.ProfilerLevel.Level1
)

具体数据采集方式以及profiler_level接口的详细介绍请参见性能分析工具使用指南中的“PyTorch训练/在线推理场景性能分析”。

采集完成后,打开采集到的某张卡数据(*ascend_pt结尾的文件夹),若包含以下数据则为可用数据: