下载
中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助
昇腾小AI

aclprofCreateConfig

函数功能

创建aclprofConfig类型的数据,表示创建Profiling配置数据。

aclProfConfig类型数据可以只创建一次、多处使用,用户需要保证数据的一致性和准确性。

如需销毁aclprofConfig类型的数据,请参见aclprofDestroyConfig

约束说明

  • 使用aclprofDestroyConfig接口销毁aclprofConfig类型的数据,如不销毁会导致内存未被释放。
  • aclprofDestroyConfig接口配对使用,先调用aclprofCreateConfig接口再调用aclprofDestroyConfig接口。

函数原型

aclprofConfig *aclprofCreateConfig(uint32_t *deviceIdList, uint32_t deviceNums, aclprofAicoreMetrics aicoreMetrics, aclprofAicoreEvents *aicoreEvents, uint64_t dataTypeConfig)

参数说明

参数名

输入/输出

说明

deviceIdList

输入

Device ID列表。须根据实际环境的Device ID配置。

deviceNums

输入

Device的个数。需由用户保证deviceIdList中的Device个数与deviceNums参数值一致,否则可能会导致后续业务异常。

aicoreMetrics

输入

表示AI Core性能指标采集项。

aicoreEvents

输入

表示AI Core事件,目前配置为NULL。

dataTypeConfig

输入

用户选择如下多个宏进行逻辑或(例如:ACL_PROF_ACL_API | ACL_PROF_AICORE_METRICS),作为dataTypeConfig参数值。每个宏表示某一类性能数据,详细说明如下:

  • ACL_PROF_ACL_API:表示采集AscendCL接口的性能数据,包括Host与Device之间、Device间的同步异步内存复制时延等。
  • ACL_PROF_TASK_TIME:采集算子下发耗时、算子执行耗时数据以及算子基本信息数据,提供更全面的性能分析数据。
  • ACL_PROF_TASK_TIME_L0:采集算子下发耗时、算子执行耗时数据。与ACL_PROF_TASK_TIME相比,由于不采集算子基本信息数据,采集时性能开销较小,可更精准统计相关耗时数据。
  • ACL_PROF_OP_ATTR:控制采集算子的属性信息,当前仅支持aclnn算子。
  • ACL_PROF_AICORE_METRICS:表示采集AI Core性能指标数据,逻辑或时必须包括该宏,aicoreMetrics入参处配置的性能指标采集项才有效。
  • ACL_PROF_TASK_MEMORY:控制CANN算子的内存占用情况采集开关,用于优化内存使用。单算子场景下,按照GE组件维度和算子维度采集算子内存大小及生命周期信息(单算子API执行方式不采集GE组件内存);静态图和静态子图场景下,在算子编译阶段按照算子维度采集算子内存大小及生命周期信息。
  • ACL_PROF_AICPU:表示采集AI CPU任务的开始、结束数据。
  • ACL_PROF_L2CACHE:表示采集L2 Cache数据(Atlas 200/300/500 推理产品不支持)。
  • ACL_PROF_HCCL_TRACE:控制HCCL数据采集开关。
  • ACL_PROF_MSPROFTX:获取用户和上层框架程序输出的性能数据。需要先在应用程序脚本中添加Profiling AscendCL API for Extension(Profiling AscendCL API扩展接口)
  • ACL_PROF_TRAINING_TRACE:控制迭代轨迹数据采集开关。
  • ACL_PROF_RUNTIME_API:控制runtime api性能数据采集开关。

返回值说明

  • 返回aclprofConfig类型的指针,表示成功。
  • 返回nullptr,表示失败。
搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词