aclInit
函数功能
AscendCL初始化函数,同步接口。
约束说明
- 一个进程内只能调用一次aclInit接口。
- 使用AscendCL接口开发应用时,必须先调用aclInit接口,否则可能会导致后续系统内部资源初始化出错,进而导致其它业务异常。
函数原型
aclError aclInit(const char *configPath)
参数说明
参数名 |
输入/输出 |
说明 |
---|---|---|
configPath |
输入 |
配置文件所在路径的指针,包含文件名,配置文件内容为json格式(json文件内的“{”的层级最多为10,“[”的层级最多为10)。如果以下的默认配置已满足需求,无需修改,可向aclInit接口中传入NULL,或者可将配置文件配置为空json串(即配置文件中只有{})。 配置文件格式为json格式,当前支持以下配置:
建议不要同时配置dump信息和Profiling采集信息,否则dump操作会影响系统性能,导致Profiling采集的性能数据指标不准确。 |
返回值说明
返回0表示成功,返回其它值表示失败。
配置文件示例(溢出算子Dump配置)
溢出算子Dump配置的相关约束说明如下:
- 将dump_debug配置为on表示开启溢出算子配置,不配置dump_debug或将dump_debug配置为off表示不开启溢出算子配置。
- 若开启溢出算子配置,则dump_path必须配置,表示导出数据文件的存储路径。
获取导出的数据文件后,如何解析请参见溢出算子数据采集及分析。
- 溢出算子Dump配置,不能与模型Dump配置或单算子Dump配置同时开启,否则会返回报错。
配置文件中的示例内容如下:
{ "dump":{ "dump_path":"output", "dump_debug":"on" } }
配置文件示例(算子缓存信息老化配置)
算子缓存信息老化配置的相关约束说明如下:
- 对于静态加载的算子,调用aclopSetModelDir接口加载指定目录下的单算子模型或调用aclopLoad接口加载指定单算子模型时,老化配置无效,不会对该部分的算子信息做老化。
- 在线编译算子的场景下,调用aclopCompile接口编译算子或调用aclopCompileAndExecute接口编译执行算子时,接口内部会按照入参加载单算子模型,老化配置有效。
如果用户调用aclopCompile接口编译算子、调用aclopExecuteV2接口执行算子,则在编译算子后需及时执行算子,否则可能导致执行算子时,算子信息已被老化,需要重新编译。建议调用aclopCompileAndExecuteV2接口编译执行算子。
- AscendCL内部分开维护固定Shape和动态Shape算子的映射队列,最大长度都为max_opqueue_num参数值。
- max_opqueue_num参数值为静态加载算子的单算子模型个数和在线编译算子的单算子模型个数的总和,因此max_opqueue_num参数值应大于当前进程中可用的、静态加载算子的单算子模型个数,否则会导致在线编译算子的信息无法老化。
配置文件中的示例内容如下:
{ "max_opqueue_num": "10000" }
相关接口
AscendCL还提供了其它使能Dump或Profiling的接口,如下,与aclInit不同的是,以下这些接口相对灵活,可以在一个进程内调用多次接口,每次调用接口时可以基于不同的Dump配置或Profiling配置。
- 获取Dump数据,参见aclmdlInitDump、aclmdlSetDump、aclmdlFinalizeDump。
- 获取Profiling数据,参见Profiling数据采集。
参考资源
接口调用示例,参见AscendCL初始化与去初始化。
父主题: 系统配置