下载
中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助
昇腾小AI

api_statistic(API耗时统计信息)

API耗时信息统计数据timeline信息在msprof*.json文件的CANN层级展示,summary信息在api_statistic_*.csv文件汇总,用于统计CANN层的API执行耗时信息,主要包括AscendCL、Runtime、Node、Model、HCCL层级的API。

  • AscendCL:AscendCL API,昇腾平台上开发深度神经网络应用的C语言API库。
  • Runtime:Runtime API,CANN运行时API。
  • Node:对应CANN层算子。
  • Model:模型,内部分析使用,无须关注。
  • HCCL:集合通信算子。

支持的型号

Atlas 200/300/500 推理产品

Atlas 200/500 A2推理产品

Atlas 推理系列产品

Atlas 训练系列产品

Atlas A2训练系列产品/Atlas 800I A2推理产品

msprof_*.json文件的CANN层级数据说明

msprof_*.json文件CANN层数据部分主要展示当前Thread下运行的接口耗时,如下图所示。

通过图中的timeline色块,可以直接观察到哪些接口耗时较长,并通过单击选中耗时较长的接口查看该接口的详细信息,如下表所示。

表1 字段说明

字段名

字段含义

Title

选择某个接口名称。

Start

显示界面中时间轴上的时刻点,chrome trace自动对齐,单位ms。

Wall Duration

表示当前接口调用耗时,单位ms。

Self Time

表示当前接口本身执行耗时,单位ms。

Mode

AscendCL API类型。包含:ACL_OP(单算子模型接口)、ACL_MODEL(模型接口)、ACL_RTS(Runtime接口)等。

level

层级,当前为AscendCL层。

api_statistic_*.csv文件说明

api_statistic_*.csv文件内容格式示例如下:

上图根据Time列进行降序排列,找出耗时最长的TopN算子;也可以根据最大、最小、平均耗时、方差等信息判断该算子运行是否稳定或者是否存在某次调用耗时较长的情况。

表2 字段说明

字段名

字段含义

Device_id

设备ID。

Level

API所属层级,包含AscendCL、Runtime、Node、Model、HCCL层级的API。

API Name

API名称。

Time(us)

总耗时,单位us。

Count

调用次数。

Avg(us)

耗时平均值,单位us。

Min(us)

最小耗时,单位us。

Max(us)

最大耗时,单位us。

Variance

耗时方差。

搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词