函数功能
aclprofCreateConfig接口的扩展接口,用于设置性能数据采集参数。同步接口。
该接口支持多次调用,用户需要保证数据的一致性和准确性。
函数原型
aclError aclprofSetConfig(aclprofConfigType configType, const char *config, uint32_t configLength)
参数说明
参数名 |
输入/输出 |
说明 |
configType |
输入 |
用户选择如下多个宏进行逻辑或(例如:ACL_PROF_SYS_HARDWARE_MEM_FREQ | ACL_PROF_SYS_IO_FREQ),作为configType参数值。每个宏表示某一类性能数据,详细说明如下:
- ACL_PROF_STORAGE_LIMIT :指定落盘目录允许存放的最大文件容量,有效取值范围为[200, 4294967295],单位为MB。
- ACL_PROF_SYS_HARDWARE_MEM_FREQ:片上内存的带宽及内存信息采集频率、LLC的读写带宽数据采集频率以及acc_pmu数据和SOC传输带宽信息采集频率,范围[1,100]。
不同产品支持情况不同,请以实际实现为准。
- ACL_PROF_LLC_MODE:LLC Profiling采集事件。可以设置为:
- Atlas 200/300/500 推理产品:
- capacity:采集AI CPU和Control CPU的LLC capacity数据。
- bandwidth:采集LLC bandwidth。默认值为capacity。
- Atlas 推理系列产品:
- read:读事件,三级缓存读速率。
- write:写事件,三级缓存写速率。默认为read。
- Atlas 训练系列产品:
- read:读事件,三级缓存读速率。
- write:写事件,三级缓存写速率。默认为read。
- Atlas A2训练系列产品:
- read:读事件,三级缓存读速率。
- write:写事件,三级缓存写速率。默认为read。
- ACL_PROF_SYS_IO_FREQ:NIC(Atlas 200/300/500 推理产品)(Atlas 训练系列产品)、ROCE(Atlas 训练系列产品)(Atlas A2训练系列产品)采集频率,范围[1,100]。
- ACL_PROF_SYS_INTERCONNECTION_FREQ:集合通信带宽数据(HCCS)(Atlas 训练系列产品)(Atlas A2训练系列产品)、PCIe数据(Atlas 推理系列产品)(Atlas 训练系列产品)(Atlas A2训练系列产品)采集频率以及片间传输带宽信息采集频率,范围[1,50]。
- ACL_PROF_DVPP_FREQ:DVPP采集频率,范围[1,100]。
- ACL_PROF_HOST_SYS:Host侧进程级别的性能数据采集开关,取值包括cpu和mem。
- ACL_PROF_HOST_SYS_USAGE:Host侧系统和所有进程的性能数据采集开关,取值包括cpu和mem。
- ACL_PROF_HOST_SYS_USAGE_FREQ:CPU利用率、内存利用率的采集频率,范围[1,50]。
|
config |
输入 |
指定配置项参数值。 |
configLength |
输入 |
config的长度,单位为Byte,最大长度不超过256字节。 |