aclprofCreateConfig

函数功能

创建aclprofConfig类型的数据,表示创建Profiling配置数据。同步接口。

aclProfConfig类型数据可以只创建一次、多处使用,用户需要保证数据的一致性和准确性。

如需销毁aclprofConfig类型的数据,请参见aclprofDestroyConfig

约束说明

函数原型

aclprofConfig *aclprofCreateConfig(uint32_t *deviceIdList, uint32_t deviceNums, aclprofAicoreMetrics aicoreMetrics, aclprofAicoreEvents *aicoreEvents, uint64_t dataTypeConfig)

参数说明

参数名

输入/输出

说明

deviceIdList

输入

Device ID列表。

deviceNums

输入

Device的个数。需由用户保证deviceIdList中的Device个数与deviceNums参数值一致,否则可能会导致后续业务异常。

aicoreMetrics

输入

表示AI Core性能指标采集项。

aicoreEvents

输入

表示AI Core事件,目前配置为NULL。

dataTypeConfig

输入

用户选择如下多个宏进行逻辑或(例如:ACL_PROF_ACL_API | ACL_PROF_AICORE_METRICS),作为dataTypeConfig参数值。每个宏表示某一类性能数据,详细说明如下:

  • ACL_PROF_ACL_API:表示采集AscendCL接口的性能数据,包括Host与Device之间、Device间的同步异步内存复制时延等。
  • ACL_PROF_TASK_TIME:表示采集AI Core算子的执行时间,包括Host与Device之间、Device间的同步异步内存复制时延等。
  • ACL_PROF_AICORE_METRICS:表示采集AI Core性能指标数据,逻辑或时必须包括该宏,aicoreMetrics入参处配置的性能指标采集项才有效。
  • ACL_PROF_AICPU:表示采集AI CPU任务的开始、结束数据。
  • ACL_PROF_L2CACHE:表示采集L2 Cache数据。
  • ACL_PROF_HCCL_TRACE:控制hccl数据采集开关。
  • ACL_PROF_MSPROFTX:获取用户和上层框架程序输出的性能数据。
  • ACL_PROF_RUNTIME_API:控制runtime api性能数据采集开关。

返回值说明