typedef enum { ACL_MDL_PRIORITY_INT32 = 0, ACL_MDL_LOAD_TYPE_SIZET, ACL_MDL_PATH_PTR, ACL_MDL_MEM_ADDR_PTR, ACL_MDL_MEM_SIZET, ACL_MDL_WEIGHT_ADDR_PTR, ACL_MDL_WEIGHT_SIZET, ACL_MDL_WORKSPACE_ADDR_PTR, ACL_MDL_WORKSPACE_SIZET, ACL_MDL_INPUTQ_NUM_SIZET, ACL_MDL_INPUTQ_ADDR_PTR, ACL_MDL_OUTPUTQ_NUM_SIZET, ACL_MDL_OUTPUTQ_ADDR_PTR, ACL_MDL_WORKSPACE_MEM_OPTIMIZE } aclmdlConfigAttr;
选项 |
取值说明 |
---|---|
ACL_MDL_PRIORITY_INT32 |
模型执行的优先级,数字越小优先级越高,取值[0,7],可选项。默认值为0。 Atlas 训练系列产品,docker容器内安装CANN,且配置算力分组的场景,该枚举值不生效。 |
ACL_MDL_LOAD_TYPE_SIZET |
模型加载方式,必选项。 ACL_MDL_LOAD_TYPE_SIZET(表示模型加载方式)的取值使用如下宏:
|
ACL_MDL_PATH_PTR |
离线模型文件路径的指针,如果选择从文件加载模型,则该选项必选。 |
ACL_MDL_MEM_ADDR_PTR |
模型在内存中的起始地址,如果选择从内存加载模型,则该选项必选。 |
ACL_MDL_MEM_SIZET |
模型在内存中的大小,如果选择从内存加载模型,则该选项必选,与ACL_MDL_MEM_ADDR_PTR选项配合使用。 |
ACL_MDL_WEIGHT_ADDR_PTR |
Device上模型权值内存(存放权值数据)的指针,如果需要由用户管理权值内存,则该选项必选。若不配置该选项,则表示由系统管理内存。 |
ACL_MDL_WEIGHT_SIZET |
权值内存大小,单位为Byte,如果需要由用户管理权值内存,则该选项必选,与ACL_MDL_WEIGHT_ADDR_PTR选项配合使用。 |
ACL_MDL_WORKSPACE_ADDR_PTR |
Device上模型所需工作内存(存放模型执行过程中的临时数据)的指针,如果需要由用户管理工作内存,则该选项必选。若不配置该选项,则表示由系统管理内存。 |
ACL_MDL_WORKSPACE_SIZET |
模型所需工作内存的大小,单位为Byte,如果需要由用户管理工作内存,则该选项必选,与ACL_MDL_WORKSPACE_ADDR_PTR选项配合使用。 |
ACL_MDL_INPUTQ_NUM_SIZET |
模型输入队列大小 ,带队列加载模型时,该选项必选,与ACL_MDL_INPUTQ_ADDR_PTR选项配合使用。 |
ACL_MDL_INPUTQ_ADDR_PTR |
模型输入队列ID的指针,带队列加载模型时,该选项必选,一个模型输入对应一个队列ID。 |
ACL_MDL_OUTPUTQ_NUM_SIZET |
模型输出队列大小,带队列加载模型时,该选项必选,与ACL_MDL_OUTPUTQ_ADDR_PTR选项配置使用。 |
ACL_MDL_OUTPUTQ_ADDR_PTR |
模型输出队列ID的指针,带队列加载模型时,该选项必选,一个模型输出对应一个队列ID。 |
ACL_MDL_WORKSPACE_MEM_OPTIMIZE |
是否开启模型工作内存优化功能,1开启,0不开启。 若关注内存规划或内存资源有限时,建议在模型加载前,开启工作内存优化功能,此时工作内存中不包含存放模型输入、输出数据的内存,工作内存大小会减小,达到节省内存的目的。 在模型执行前,还需要由用户申请存放模型输入、输出数据的内存,因此即使在模型加载时开启工作内存优化功能,也不会影响后续的模型执行。 |
关于如何获取om文件,请参见模型构建。
对om模型文件大小有限制的场景下,如果使用ATC工具生成om文件时,将--external_weight参数设置为1(1表示将原始网络中的Const/Constant节点的权重保存在单独的文件中,且该文件保存在与om文件同级的weight目录下),那么在使用本接口加载om文件时,需将weight目录与om文件放在同级目录下,这时AscendCL会自行到weight目录下查找权重文件,否则可能会导致单独的权重文件加载不成功。