接口调用流程
- 对同一个模型,不能同时调用acl.mdl.set_dynamic_batch_size接口设置动态Batch、调用acl.mdl.set_dynamic_hw_size接口设置动态分辨率、调用acl.mdl.set_input_dynamic_dims接口设置动态维度的维度值。
- 对同一个模型,AIPP(包括静态AIPP和动态AIPP)与动态维度(ND格式)不能同时使用。
动态Shape输入场景下模型推理与开发基础推理应用的流程类似,都涉及pyACL初始化与去初始化、运行管理资源申请与释放、模型构建、模型加载、模型执行、模型卸载等。
本节中重点描述动态Shape输入场景下模型推理与开发基础推理应用的不同之处:
- 构建模型时,需配置动态Batch、动态分辨率、动态维度(ND格式)相关的信息:
构建模型成功后,在生成的om模型中,会新增相应的输入(下文简称动态Batch/动态分辨率/动态维度输入),在模型推理时通过该新增的输入提供具体的Batch值/分辨率/维度值。
例如,a输入的batch数是动态的,在om模型中,会新增与a对应的b输入来描述a的batch信息。在模型执行时,准备a输入的数据结构请参见准备模型执行的输入/输出数据结构,准备b输入的数据结构、设置b输入的数据请参见以下内容。
- 在执行模型推理前:
- 需准备动态Batch/动态分辨率/动态维度输入的数据结构:
- 申请动态Batch/动态分辨率/动态维度输入对应的内存前,需要先调用acl.mdl.get_input_index_by_name接口根据输入名称(固定为“ascend_mbatch_shape_data”)获取模型中标识该输入的index。
- 调用acl.mdl.get_input_size_by_index根据index获取输入内存大小。
- 调用acl.rt.malloc接口根据上一步骤中的大小申请内存。
申请动态Batch/动态分辨率/动态AIPP/动态维度输入对应的内存后,无需用户设置该内存中的数据(否则可能会导致业务异常),用户调用上一步骤中的接口后,系统会自动向该内存中填入数据。
- 调用acl.create_data_buffer接口创建aclDataBuffer类型的数据,用于存放动态Batch/动态分辨率/动态维度输入数据的内存地址、内存大小。
- 调用acl.mdl.create_dataset接口创建aclmdlDataset类型的数据,并调用acl.mdl.add_dataset_buffer接口向aclmdlDataset类型的数据中增加aclDataBuffer类型的数据。
- 需设置动态Batch数/动态分辨率/动态维度参数值:
图1 接口调用流程
- 调用acl.mdl.get_input_index_by_name接口根据输入名称(固定为“ascend_mbatch_shape_data”)获取模型中标识该输入的index。
- 设置动态Batch数/动态分辨率/动态维度参数值。
- 调用acl.mdl.set_dynamic_batch_size接口设置动态Batch数。
此处设置的Batch数只能是构建模型时设置的Batch档位中的某一个。
也可以调用acl.mdl.get_dynamic_batch接口获取指定模型支持的Batch档位数以及每一档中的Batch数。
- 调用acl.mdl.set_dynamic_hw_size接口设置动态分辨率。
此处设置的分辨率只能是构建模型时设置的分辨率档位中的某一个。
也可以调用acl.mdl.get_dynamic_hw接口获取指定模型支持的分辨率档位数以及每一档中的宽、高。
- 调用acl.mdl.set_input_dynamic_dims接口设置动态维度的维度值。
此处设置的动态维度的值只能是构建模型时设置的档位中的某一档。
也可以调用acl.mdl.get_input_dynamic_dims接口获取指定模型支持的动态维度档位数以及每一档中的值。
- 调用acl.mdl.set_dynamic_batch_size接口设置动态Batch数。
- 需准备动态Batch/动态分辨率/动态维度输入的数据结构:
父主题: 模型动态推理