下载
中文
注册

动态维度(ND格式)

基本原理

若模型推理时包含动态维度(ND格式)特性,在模型推理时,需调用AscendCL提供的接口设置模型推理时需使用的维度值,完整流程请参见模型执行。关键原理说明如下:

  1. 加载模型。模型加载的详细流程,请参见模型加载,模型加载成功后,返回标识模型的ID。

    对于动态维度,模型支持哪些维度值已提前在构建模型时配置(构建模型的说明请参见模型构建),构建模型成功后,在生成的om模型中,会新增一个输入(下文简称动态维度输入),在模型推理时通过该新增的输入提供具体的维度值。

    例如,a输入的某个维度值是动态的,在om模型中,会有与a对应的b输入来描述a的维度信息。在模型执行时,准备a输入的数据结构请参见准备模型执行的输入/输出数据结构,准备b输入的数据结构、设置b输入的数据请依次参见23.在成功加载模型之后,执行模型之前,设置动态维...

  2. 创建aclmdlDataset类型的数据,用于描述模型执行的输入、输出,详细调用流程请参见准备模型执行的输入/输出数据结构
    其中,动态维度输入的注意点如下:
    1. 申请动态维度输入对应的内存前,需要先调用aclmdlGetInputIndexByName接口根据输入名称(固定为ACL_DYNAMIC_TENSOR_NAME)获取模型中标识动态维度输入的index。
      ACL_DYNAMIC_TENSOR_NAME是一个宏,宏的定义如下:
      #define ACL_DYNAMIC_TENSOR_NAME "ascend_mbatch_shape_data"
    2. 调用aclmdlGetInputSizeByIndex根据index获取输入内存大小。
    3. 调用aclrtMalloc接口根据2.b中的大小申请内存。

      申请动态维度输入对应的内存后,无需用户设置该内存中的数据(否则可能会导致业务异常),用户调用3.b中的接口后,系统会自动向该内存中填入数据。

    4. 调用aclCreateDataBuffer接口创建aclDataBuffer类型的数据,用于存放动态维度输入数据的内存地址、内存大小。
    5. 调用aclmdlCreateDataset接口创建aclmdlDataset类型的数据,并调用aclmdlAddDatasetBuffer接口向aclmdlDataset类型的数据中增加aclDataBuffer类型的数据。
  3. 在成功加载模型之后,执行模型之前,设置动态维度的维度值。
    1. 调用aclmdlGetInputIndexByName接口根据输入名称(固定为ACL_DYNAMIC_TENSOR_NAME)获取模型中标识动态维度输入的index。
    2. 调用aclmdlSetInputDynamicDims接口设置动态维度的维度值。

      此处设置的动态维度的值只能是构建模型时设置的档位中的某一档。

      也可以调用aclmdlGetInputDynamicDims接口获取指定模型支持的动态维度档位数以及每一档中的值。

  4. 执行模型。

    例如,调用aclmdlExecute接口(同步接口)执行模型。

示例代码

调用接口后,需增加异常处理的分支,并记录报错日志、提示日志,此处不一一列举。以下是关键步骤的代码示例,不可以直接拷贝编译运行,仅供参考。

//1.模型加载,加载成功后,再设置动态维度
//......

//2.准备模型描述信息modelDesc_,准备模型的输入数据input_和模型的输出数据output_
//......

//3.自定义函数,设置动态维度
int  ModelSetDynamicInfo()
{
        size_t index;
        //3.1 获取动态维度输入的index,标识动态维度输入的输入名称固定为ACL_DYNAMIC_TENSOR_NAME
        aclError ret = aclmdlGetInputIndexByName(modelDesc_, ACL_DYNAMIC_TENSOR_NAME, &index);
        //3.2 设置具体档位信息,包括维度数dimCount和各个维度的数值,modelId_表示加载成功的模型的ID,input_表示aclmdlDataset类型的数据,index表示标识动态维度输入的输入index
        aclmdlIODims currentDims;
        currentDims.dimCount = 4;
        currentDims.dims[0] = 8;
        currentDims.dims[1] = 3;
        currentDims.dims[2] = 224;
        currentDims.dims[3] = 224;
        ret = aclmdlSetInputDynamicDims(modelId_, input_, index, &currentDims);
        //......
}

//4.自定义函数,执行模型
int ModelExecute(int index)
{
        aclError ret;
        //4.1 调用自定义函数,设置动态维度
	ret = ModelSetDynamicInfo();
        //4.2 执行模型,modelId_表示加载成功的模型的ID,input_和output_分别表示模型的输入和输出
        ret = aclmdlExecute(modelId_, input_, output_);
        //......
}
//5.处理模型推理结果
//TODO