动态Batch/动态分辨率/动态维度(设置多档维度值)
本节介绍动态Batch/动态分辨率/动态维度功能涉及的关键接口、接口调用流程及示例代码。
接口调用流程
动态Shape输入场景下模型推理与模型推理的流程类似,都涉及AscendCL初始化与去初始化、运行管理资源申请与释放、模型构建、模型加载、模型执行、模型卸载等。
本节中重点描述动态Shape输入场景下模型推理与模型推理的不同之处:
- 构建模型时,需配置动态Batch、动态分辨率、动态维度(ND格式)相关的信息:
若模型推理时包含动态Batch特性,在模型推理时,需调用AscendCL提供的接口设置模型推理时需使用的batch size,模型支持的batch size已提前在构建模型时配置(使用ATC工具的dynamic_batch_size参数)。
若模型推理时包含动态分辨率特性,在模型推理时,需调用AscendCL提供的接口设置模型推理时需使用的分辨率,模型支持的分辨率已提前在构建模型时配置(使用ATC工具的dynamic_image_size参数)。
若模型推理时包含动态维度(ND格式)特性,在模型推理时,需调用AscendCL提供的接口设置模型推理时需使用的维度值,模型支持哪些维度值已提前在构建模型时配置(使用ATC工具的dynamic_dims参数)。
构建模型成功后,在生成的om模型中,会新增相应的输入(下文简称动态Batch/动态分辨率/动态维度输入),在模型推理时通过该新增的输入提供具体的Batch值/分辨率/维度值。
例如,a输入的batch size是动态的,在om模型中,会新增与a对应的b输入来描述a的batch信息。在模型执行时,准备a输入的数据结构请参见准备模型执行的输入/输出数据结构,准备b输入的数据结构、设置b输入的数据请参见2。
- 在执行模型推理前:
- 需准备动态Batch/动态分辨率/动态维度输入的数据结构:
- 申请动态Batch/动态分辨率/动态维度输入对应的内存前,需要先调用aclmdlGetInputIndexByName接口根据输入名称(固定为ACL_DYNAMIC_TENSOR_NAME)获取模型中标识该输入的index。
ACL_DYNAMIC_TENSOR_NAME是一个宏,宏的定义如下:
#define ACL_DYNAMIC_TENSOR_NAME "ascend_mbatch_shape_data"
- 调用aclmdlGetInputSizeByIndex根据index获取输入内存大小。
- 调用aclrtMalloc接口根据2.b中的大小申请内存。
申请动态Batch/动态分辨率/动态AIPP/动态维度输入对应的内存后,无需用户设置该内存中的数据(否则可能会导致业务异常),用户调用2.b中的接口后,系统会自动向该内存中填入数据。
- 调用aclCreateDataBuffer接口创建aclDataBuffer类型的数据,用于存放动态Batch/动态分辨率/动态维度输入数据的内存地址、内存大小。
- 调用aclmdlCreateDataset接口创建aclmdlDataset类型的数据,并调用aclmdlAddDatasetBuffer接口向aclmdlDataset类型的数据中增加aclDataBuffer类型的数据。
- 申请动态Batch/动态分辨率/动态维度输入对应的内存前,需要先调用aclmdlGetInputIndexByName接口根据输入名称(固定为ACL_DYNAMIC_TENSOR_NAME)获取模型中标识该输入的index。
- 需设置动态Batch/动态分辨率/动态维度参数值:
图1 接口调用流程
- 调用aclmdlGetInputIndexByName接口根据输入名称(固定为ACL_DYNAMIC_TENSOR_NAME)获取模型中标识该输入的index。
- 设置动态Batch/动态分辨率/动态维度参数值。
- 需准备动态Batch/动态分辨率/动态维度输入的数据结构:
动态Batch示例代码
本节中的示例重点介绍模型推理的代码逻辑,AscendCL初始化和去初始化请参见AscendCL初始化,运行管理资源申请与释放请参见运行管理资源申请与释放。
调用接口后,需增加异常处理的分支,并记录报错日志、提示日志,此处不一一列举。以下是关键步骤的代码示例,不可以直接拷贝编译运行,仅供参考。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 |
// 1. AscendCL初始化 // 2. 申请运行管理资源 // 3.模型加载,加载成功后,再设置动态Batch // ...... // 4.准备模型描述信息modelDesc_,准备模型的输入数据input_和模型的输出数据output_ // ...... // 5.自定义函数,设置动态Batch int ModelSetDynamicInfo() { size_t index; // 3.1 获取动态Batch输入的index,标识动态Batch输入的输入名称固定为ACL_DYNAMIC_TENSOR_NAME aclError ret = aclmdlGetInputIndexByName(modelDesc_, ACL_DYNAMIC_TENSOR_NAME, &index); // 3.2 设置Batch // modelId_表示加载成功的模型的ID,input_表示aclmdlDataset类型的数据,index表示标识动态Batch输入的输入index,batchSize表示Batch数(此处以8为例) uint64_t batchSize = 8; ret = aclmdlSetDynamicBatchSize(modelId_, input_, index, batchSize); // ...... } // 6.自定义函数,执行模型 int ModelExecute(int index) { aclError ret; // 4.1 调用自定义函数,设置动态Batch ret = ModelSetDynamicInfo(); // 4.2 执行模型,modelId_表示加载成功的模型的ID,input_和output_分别表示模型的输入和输出 ret = aclmdlExecute(modelId_, input_, output_); // ...... } // 7.处理模型推理结果 // 8. 释放运行管理资源 // 9. AscendCL去初始化 // ...... |
动态分辨率示例代码
本节中的示例重点介绍模型推理的代码逻辑,AscendCL初始化和去初始化请参见AscendCL初始化,运行管理资源申请与释放请参见运行管理资源申请与释放。
调用接口后,需增加异常处理的分支,并记录报错日志、提示日志,此处不一一列举。以下是关键步骤的代码示例,不可以直接拷贝编译运行,仅供参考。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 |
// 1. AscendCL初始化 // 2. 申请运行管理资源 // 3.模型加载,加载成功后,再设置动态分辨率 // ...... // 4.准备模型描述信息modelDesc_,准备模型的输入数据input_和模型的输出数据output_ // ...... // 5.自定义函数,设置动态分辨率 int ModelSetDynamicInfo() { size_t index; // 3.1 获取动态分辨率输入的index,标识动态分辨率输入的输入名称固定为ACL_DYNAMIC_TENSOR_NAME aclError ret = aclmdlGetInputIndexByName(modelDesc_, ACL_DYNAMIC_TENSOR_NAME, &index); // 3.2 设置输入图片分辨率,modelId_表示加载成功的模型的ID,input_表示aclmdlDataset类型的数据,index表示标识动态分辨率输入的输入index uint64_t height = 224; uint64_t width = 224; ret = aclmdlSetDynamicHWSize(modelId_, input_, index, height, width); // ...... } // 6.自定义函数,执行模型 int ModelExecute(int index) { aclError ret; // 4.1 调用自定义函数,设置动态分辨率 ret = ModelSetDynamicInfo(); // 4.2 执行模型,modelId_表示加载成功的模型的ID,input_和output_分别表示模型的输入和输出 ret = aclmdlExecute(modelId_, input_, output_); // ...... } // 7.处理模型推理结果 // 8. 释放运行管理资源 // 9. AscendCL去初始化 // ...... |
ND格式,动态维度示例代码
本节中的示例重点介绍模型推理的代码逻辑,AscendCL初始化和去初始化请参见AscendCL初始化,运行管理资源申请与释放请参见运行管理资源申请与释放。
调用接口后,需增加异常处理的分支,并记录报错日志、提示日志,此处不一一列举。以下是关键步骤的代码示例,不可以直接拷贝编译运行,仅供参考。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 |
// 1. AscendCL初始化 // 2. 申请运行管理资源 // 3.模型加载,加载成功后,再设置动态维度 // ...... // 4.准备模型描述信息modelDesc_,准备模型的输入数据input_和模型的输出数据output_ // ...... // 5.自定义函数,设置动态维度 int ModelSetDynamicInfo() { size_t index; // 3.1 获取动态维度输入的index,标识动态维度输入的输入名称固定为ACL_DYNAMIC_TENSOR_NAME aclError ret = aclmdlGetInputIndexByName(modelDesc_, ACL_DYNAMIC_TENSOR_NAME, &index); // 3.2 设置具体档位信息,包括维度数dimCount和各个维度的数值,modelId_表示加载成功的模型的ID,input_表示aclmdlDataset类型的数据,index表示标识动态维度输入的输入index aclmdlIODims currentDims; currentDims.dimCount = 4; currentDims.dims[0] = 8; currentDims.dims[1] = 3; currentDims.dims[2] = 224; currentDims.dims[3] = 224; ret = aclmdlSetInputDynamicDims(modelId_, input_, index, ¤tDims); // ...... } // 6.自定义函数,执行模型 int ModelExecute(int index) { aclError ret; // 4.1 调用自定义函数,设置动态维度 ret = ModelSetDynamicInfo(); // 4.2 执行模型,modelId_表示加载成功的模型的ID,input_和output_分别表示模型的输入和输出 ret = aclmdlExecute(modelId_, input_, output_); // ...... } // 7.处理模型推理结果 // 8. 释放运行管理资源 // 9. AscendCL去初始化 // ...... |