函数:init
C函数原型 |
aclError aclInit(const char *configPath) |
---|---|
Python函数 |
ret = acl.init(config_path) |
函数功能 |
pyACL初始化函数。 |
输入说明 |
config_path:str,配置文件所在的路径,包含文件名。 配置文件内容为JSON格式(JSON文件内的“{”的层级最多为10,“[”的层级最多为10)。如果以下的默认配置已满足需求,无需修改,可直接调用acl.init接口不传入参数或者可将配置文件配置为空JSON串(即配置文件中只有{})。 配置文件格式为JSON格式,当前支持以下配置:
建议不要同时配置dump信息和Profiling采集信息,否则dump操作会影响系统性能,导致Profiling采集的性能数据指标不准确。 |
返回值说明 |
ret:int,错误码。
|
约束说明 |
|
相关接口 |
pyACL还提供了其它使能Dump或Profiling的接口,如下,与acl.init不同的是,以下这些接口相对灵活,可以在一个进程内调用多次接口,每次调用接口时可以基于不同的Dump配置或Profiling配置。
|
参考资源 |
配置文件示例(模型Dump配置、单算子Dump配置)
模型Dump配置示例如下:
{ "dump":{ "dump_list":[ { "model_name":"ResNet-101" }, { "model_name":"ResNet-50", "layer":[ "conv1conv1_relu", "res2a_branch2ares2a_branch2a_relu", "res2a_branch1", "pool1" ] } ], "dump_path":"/home/HwHiAiUser/output", "dump_mode":"output", "dump_op_switch":"off" } }
单算子Dump配置示例如下:
{ "dump":{ "dump_path":"output", "dump_list":[], "dump_op_switch":"on" } }
配置项 |
参数说明 |
备注 |
---|---|---|
dump |
- |
|
dump_list |
(必填)待dump数据的整网模型列表。 创建模型dump配置信息,当存在多个模型需要dump时,需要每个模型之间用英文逗号隔开。 在单算子执行场景下,dump_list为空。 |
- |
model_name |
模型名称。
|
|
layer |
算子名。
|
在IO性能相对较差的开发板(比如Atlas 200 DK)上,可能会出现由于数据量过大导致执行超时,所以不建议全量dump,请指定算子进行dump。 |
dump_path |
(必填)dump数据文件存储到运行环境的目录。
支持配置绝对路径或相对路径:
|
该参数指定的目录需要提前创建且确保安装时配置的运行用户具有读写权限。 |
dump_mode |
dump数据模式。
|
- |
dump_op_switch |
单算子模型dump数据开关。
|
- |
dump_step |
指定采集哪些迭代的Dump数据。推理场景无需配置。 不配置该参数,默认所有迭代都会产生dump数据,数据量比较大,建议按需指定迭代。 多个迭代用“|”分割,例如:0|5|10;也可以用"-"指定迭代范围,例如:0|3-5|10。 配置示例: { "dump":{ "dump_list":[ ...... ], "dump_path":"/home/HwHiAiUser/output", "dump_mode":"output", "dump_op_switch":"off" "dump_step": "0|3-5|10" } } |
- |
配置文件示例(异常算子Dump配置)
将“dump_scene”参数设置为“lite_exception”,启用异常算子Dump功能,同时可配合使用“ASCEND_WORK_PATH”环境变量配置落盘路径,否则落盘在应用程序的当前执行目录下。
配置文件中的示例内容如下:
{ "dump":{ "dump_scene":"lite_exception" } }
异常算子Dump配置,不能与模型Dump配置或单算子Dump配置同时开启,否则模型Dump或单算子Dump不生效。
配置文件示例(溢出算子Dump配置)
{ "dump":{ "dump_path":"output", "dump_debug":"on" } }
配置文件示例(算子缓存信息老化配置)
算子缓存信息老化配置的相关约束说明如下:
- 对于静态加载的算子,调用acl.op.set_model_dir接口加载指定目录下的单算子模型或调用acl.op.load接口加载指定单算子模型时,老化配置无效,不会对该部分的算子信息做老化。
- pyACL内部分开维护固定Shape和动态Shape算子的映射队列,最大长度都为“max_opqueue_num”参数值。
- “max_opqueue_num”参数值为静态加载算子的单算子模型个数和在线编译算子的单算子模型个数的总和,因此“max_opqueue_num”参数值应大于当前进程中可用的、静态加载算子的单算子模型个数,否则会导致在线编译算子的信息无法老化。
配置文件中的示例内容如下:
{ "max_opqueue_num": "10000" }