动态Batch/动态分辨率/动态维度(设置多档维度值)
接口调用流程
动态Shape输入场景下模型推理与开发基础推理应用的流程类似,都涉及pyACL初始化与去初始化、运行管理资源申请与释放、模型构建、模型加载、模型执行、模型卸载等。
本节中重点描述动态Shape输入场景下模型推理与开发基础推理应用的不同之处:
- 构建模型时,需配置动态Batch、动态分辨率、动态维度(ND格式)相关的信息:
若模型推理时包含动态Batch特性,在模型推理时,需调用pyACL提供的接口设置模型推理时需使用的“batch size”,模型支持的“batch size”已提前在构建模型时配置(使用ATC工具的“dynamic_batch_size”参数)。
若模型推理时包含动态分辨率特性,在模型推理时,需调用pyACL提供的接口设置模型推理时需使用的分辨率,模型支持的分辨率已提前在构建模型时配置(使用ATC工具的“dynamic_image_size”参数)。
若模型推理时包含动态维度(ND格式)特性,在模型推理时,需调用pyACL提供的接口设置模型推理时需使用的维度值,模型支持哪些维度值已提前在构建模型时配置(使用ATC工具的“dynamic_dims”参数)。
构建模型成功后,在生成的om模型中,会新增相应的输入(下文简称动态Batch/动态分辨率/动态维度输入),在模型推理时通过该新增的输入提供具体的Batch值/分辨率/维度值。
例如,a输入的“batch size”是动态的,在om模型中,会新增与a对应的b输入来描述a的batch信息。在模型执行时,准备a输入的数据结构请参见准备模型执行的输入/输出数据结构,准备b输入的数据结构、设置b输入的数据请参见2。
- 在执行模型推理前:
- 需准备动态Batch/动态分辨率/动态维度输入的数据结构:
- 申请动态Batch/动态分辨率/动态维度输入对应的内存前,需要先调用acl.mdl.get_input_index_by_name接口根据输入名称(固定为“ascend_mbatch_shape_data”)获取模型中标识该输入的index。
- 调用acl.mdl.get_input_size_by_index根据index获取输入内存大小。
- 调用acl.rt.malloc接口根据2.b中的大小申请内存。
申请动态Batch/动态分辨率/动态AIPP/动态维度输入对应的内存后,无需用户设置该内存中的数据(否则可能会导致业务异常),用户调用2.b中的接口后,系统会自动向该内存中填入数据。
- 调用acl.create_data_buffer接口创建aclDataBuffer类型的数据,用于存放动态Batch/动态分辨率/动态维度输入数据的内存地址、内存大小。
- 调用acl.mdl.create_dataset接口创建aclmdlDataset类型的数据,并调用acl.mdl.add_dataset_buffer接口向aclmdlDataset类型的数据中增加aclDataBuffer类型的数据。
- 需设置动态Batch/动态分辨率/动态维度参数值:
图1 接口调用流程
- 调用acl.mdl.get_input_index_by_name接口根据输入名称(固定为“ascend_mbatch_shape_data”)获取模型中标识该输入的index。
- 设置动态Batch/动态分辨率/动态维度参数值。
- 调用acl.mdl.set_dynamic_batch_size接口设置动态Batch。
此处设置的“batch size”只能是构建模型时设置的Batch档位中的某一个。
也可以调用acl.mdl.get_dynamic_batch接口获取指定模型支持的Batch档位数以及每一档中的“batch size”。
- 调用acl.mdl.set_dynamic_hw_size接口设置动态分辨率。
此处设置的分辨率只能是构建模型时设置的分辨率档位中的某一个。
也可以调用acl.mdl.get_dynamic_hw接口获取指定模型支持的分辨率档位数以及每一档中的宽、高。
- 调用acl.mdl.set_input_dynamic_dims接口设置动态维度的维度值。
此处设置的动态维度的值只能是构建模型时设置的档位中的某一档。
也可以调用acl.mdl.get_input_dynamic_dims接口获取指定模型支持的动态维度档位数以及每一档中的值。
- 调用acl.mdl.set_dynamic_batch_size接口设置动态Batch。
- 需准备动态Batch/动态分辨率/动态维度输入的数据结构:
- 对同一个模型,不能同时调用acl.mdl.set_dynamic_batch_size接口设置动态Batch、调用acl.mdl.set_dynamic_hw_size接口设置动态分辨率、调用acl.mdl.set_input_dynamic_dims接口设置动态维度的维度值,只能调用其中一种。
- 申请模型推理的输出内存时,可以按照各档位的实际大小申请内存,也可以调用acl.mdl.get_output_size_by_index接口获取内存大小后再申请内存(建议使用该方式,确保内存足够)。
- 动态AIPP和动态Batch同时使用时:
- 调用acl.mdl.create_aipp接口设置“batchSize”时,“batchSize”要设置为最大Batch数。
- 模型中需要进行动态AIPP处理的data节点,其对应的输入内存大小需按照最大Batch来申请。
- 动态AIPP和动态分辨率同时使用时:
- 若在设置动态AIPP参数时,开启了抠图或缩放或补边功能,则不能与动态分辨率同时使用。
- 若在设置动态AIPP参数时,未开启抠图或缩放或补边功能,在与动态分辨率同时使用时,需确保通过acl.mdl.set_aipp_src_image_size接口设置的宽和高,与通过acl.mdl.set_dynamic_hw_size接口设置的宽和高相等,都必须设置成模型转换时动态分辨率最大档位的宽和高。
- 模型中需要进行动态AIPP处理的data节点,其对应的输入内存大小需按照最大分辨率(宽、高)来申请。
- 静态AIPP和动态分辨率同时使用时,由于动态分辨率场景下输入图片的宽和高不确定,因此在使用ATC工具的“insert_op_conf”参数传入AIPP配置文件时,AIPP配置文件中不能开启Crop和Padding功能,并且需要将配置文件中的“src_image_size_w”和“src_image_size_h”取值设置为0。
- 对同一个模型,AIPP(包括静态AIPP和动态AIPP)与动态维度(ND格式)不能同时使用。
动态Batch示例代码
调用接口后,需增加异常处理的分支,并记录报错日志、提示日志,此处不一一列举。以下是关键步骤的代码示例,不可以直接拷贝运行,仅供参考。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 |
# 1.模型加载,加载成功后,再设置动态Batch。 # ...... # 2.创建aclmdlDataset类型的数据,用于描述模型的输入数据input、输出数据output。 # ...... # 3.自定义函数,设置动态Batch。 def model_set_dynamicinfo(): # 3.1 获取动态Batch输入的index,标识动态Batch输入的输入名称固定为“ascend_mbatch_shape_data”。 index, ret = acl.mdl.get_input_index_by_name(model_desc, "ascend_mbatch_shape_data") # 3.2 设置Batch,model_id表示加载成功的模型的ID,input表示aclmdlDataset类型的数据,index表示标识动态Batch输入的输入index。 batchSize = 8 ret = acl.mdl.set_dynamic_batch_size(model_id_, input, index, batch_size) # ...... # 4.自定义函数,执行模型。 def model_execute(index): # 4.1 调用自定义函数,设置动态Batch。 ret = model_set_dynamicinfo() # 4.2 执行模型,model_id表示加载成功的模型的ID,input和output分别表示模型的输入和输出。 ret = acl.mdl.execute(model_id, input, output) # ...... } # 5.处理模型推理结果。 # ...... |
动态分辨率示例代码
调用接口后,需增加异常处理的分支,并记录报错日志、提示日志,此处不一一列举。以下是关键步骤的代码示例,不可以直接拷贝运行,仅供参考。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 |
# 1.模型加载,加载成功后,再设置动态分辨率。 # ...... # 2.创建aclmdlDataset类型的数据,用于描述模型的输入数据input、输出数据output。 # ...... # 3.自定义函数,设置动态分辨率。 def model_set_dynamicInfo(): # 3.1 获取动态分辨率输入的index,标识动态分辨率输入的输入名称固定为“ascend_mbatch_shape_data”。 index, ret = acl.mdl.get_input_index_by_name(modelDesc, "ascend_mbatch_shape_data") # 3.2 设置输入图片分辨率,model_id表示加载成功的模型的ID,input表示aclmdlDataset类型的数据,index表示标识动态分辨率输入的输入index。 height = 224 width = 224 ret = acl.mdl.set_dynamic_hw_size(model_id, input, index, height, width) # ...... # 4.自定义函数,执行模型。 def model_execute(index): # 4.1 调用自定义函数,设置动态分辨率。 ret = model_set_dynamicInfo() # 4.2 执行模型,model_id表示加载成功的模型的ID,input和output分别表示模型的输入和输出。 ret = acl.mdl.execute(model_id, input, output) # ...... # 5.处理模型推理结果。 # ...... |
ND格式,动态维度示例代码
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 |
import acl # ...... # 1.模型加载,加载成功后,再设置动态维度。 # ...... # 2.准备模型描述信息model_desc,准备模型的输入数据input_dataset和模型的输出数据output_dataset。 # ...... # 3.自定义函数,设置动态维度。 def model_set_dynamic_info(): # 3.1 获取动态维度输入的index,标识动态维度输入的输入名称固定为“ascend_mbatch_shape_data”。 index, ret = acl.mdl.get_input_index_by_name(model_desc, "ascend_mbatch_shape_data") # 3.2 设置具体档位信息,包括维度数dimCount和各个维度的数值,model_id表示加载成功的模型的ID,input_dataset表示aclmdlDataset类型的数据,index表示标识动态维度输入的输入index。 current_dims = {'name': '', 'dimCount': 4, 'dims': [8, 3, 224, 224]} ret = acl.mdl.set_input_dynamic_dims(mode_id, input_dataset, index, current_dims) # ...... # 4.自定义函数,执行模型。 def ModelExecute(int index): # 4.1 调用自定义函数,设置动态维度。 ret = model_set_dynamic_info() # 4.2 执行模型,model_id表示加载成功的模型的ID,input_dataset和output_dataset分别表示模型的输入和输出。 ret = acl.mdl.execute(model_id, input_dataset, output_dataset) # ...... # 5.处理模型推理结果。 # ...... |