下载
中文
注册

函数:create_config

C函数原型

aclprofConfig *aclprofCreateConfig(uint32_t *deviceIdlist,uint32_t deviceNums, aclprofAicoreMetrics aicoreMetrics, aclprofAicoreEvents *aicoreEvents, uint64_t dataTypeConfig)

Python函数

prof_config = acl.prof.create_config(device_list,aicore_metrics, aicore_events, data_type_config)

函数功能

创建aclprofConfig类型的数据,表示创建Profiling配置数据。

aclProfConfig类型数据可以只创建一次、多处使用,用户需要保证数据的一致性和准确性。

如需销毁aclprofConfig类型的数据,请参见函数:destroy_config

输入说明

device_list:Device ID列表。须根据实际环境的Device ID配置。

aicore_metrics:表示aclprofAicoreMetrics

aicore_events:表示AI Core事件,目前配置为0。

data_type_config

用户选择如下多个值进行逻辑或(例如:ACL_PROF_ACL_API|ACL_PROF_AICORE_METRICS),作为data_type_config参数值。每个值表示某一类性能数据,详细说明如下:

  • ACL_PROF_ACL_API:表示采集pyACL接口的性能数据,包括Host与Device之间的同步异步内存复制时延等。
  • ACL_PROF_TASK_TIME:采集算子下发耗时、算子执行耗时数据以及算子基本信息数据,提供更全面的性能分析数据。
  • ACL_PROF_TASK_TIME_L0:采集算子下发耗时、算子执行耗时数据。与ACL_PROF_TASK_TIME相比,由于不采集算子基本信息数据,采集时性能开销较小,可更精准统计相关耗时数据。
  • ACL_PROF_AICORE_METRICS:表示采集AI Core性能指标数据,逻辑或时必须包括该宏,aicore_metrics入参处配置的性能指标采集项才有效。
  • ACL_PROF_TASK_MEMORY:控制CANN算子的内存占用情况采集开关。仅采集GE组件算子。
  • ACL_PROF_AICPU:表示采集AI CPU任务的开始、结束数据。
  • ACL_PROF_L2CACHE:表示采集L2 Cache数据。
  • ACL_PROF_HCCL_TRACE:控制hccl数据采集开关。
  • ACL_PROF_MSPROFTX:获取用户和上层框架程序输出的性能数据。需要先在应用程序脚本中添加Profiling pyACL API for Extension(Profiling pyACL API扩展接口)
  • ACL_PROF_TRAINING_TRACE:控制迭代轨迹数据采集开关。
  • ACL_PROF_RUNTIME_API:控制runtime api性能数据采集开关。

返回值说明

prof_config:int。

  • 返回非0值表示成功,返回值为返回aclprofConfig类型的指针地址。
  • 返回0表示失败。

约束说明