下载
中文
注册

动态Batch

基本原理

若模型推理时包含动态Batch特性,在模型推理时,需调用pyACL提供的接口设置模型推理时需使用的Batch数,模型支持的Batch数已提前在构建模型时配置(使用ATC工具的“dynamic_batch_size”参数)。

ATC工具的参数说明请参见ATC工具使用指南

示例代码

调用接口后,需增加异常处理的分支,并记录报错日志、提示日志,此处不一一列举。以下是关键步骤的代码示例,不可以直接拷贝运行,仅供参考。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
# 1.模型加载,加载成功后,再设置动态Batch。
# ......

# 2.创建aclmdlDataset类型的数据,用于描述模型的输入数据input、输出数据output。
# ......

# 3.自定义函数,设置动态Batch。
def model_set_dynamicinfo():
    # 3.1 获取动态Batch输入的index,标识动态Batch输入的输入名称固定为“ascend_mbatch_shape_data”。
    index, ret = acl.mdl.get_input_index_by_name(model_desc, "ascend_mbatch_shape_data")
    # 3.2 设置Batch,model_id表示加载成功的模型的ID,input表示aclmdlDataset类型的数据,index表示标识动态Batch输入的输入index。
    batchSize = 8
    ret = acl.mdl.set_dynamic_batch_size(model_id_, input, index, batch_size)
    # ......

# 4.自定义函数,执行模型。
def model_execute(index):
    # 4.1 调用自定义函数,设置动态Batch。
    ret = model_set_dynamicinfo()
    # 4.2 执行模型,model_id表示加载成功的模型的ID,input和output分别表示模型的输入和输出。
    ret = acl.mdl.execute(model_id, input, output)
    # ......
}

# 5.处理模型推理结果。
# ......