下载
中文
注册

aclmdlExecuteAsync

函数功能

执行模型推理,异步接口。

约束说明

  • 对同一个modelId的模型,不能调用aclmdlExecuteAsync接口执行多Stream并发场景下的模型推理。错误示例如下,该示例中,两次aclmdlExecuteAsync接口多Stream并发执行,导致报错:
    //......
    aclmdlExecuteAsync(modelId1, input, output, stream1);
    aclmdlExecuteAsync(modelId1, input, output, stream2);
    aclrtSynchronizeStream(stream1);
    aclrtSynchronizeStream(stream2);
    //......
  • 对同一个modelId的模型,由于与模型关联的资源(例如stream、内存等)唯一,因此不能在多线程中并发使用,否则,可能导致业务异常。
  • 模型加载、模型执行、模型卸载的操作必须在同一个Context下(关于Context的创建请参见aclrtCreateContext)。

函数原型

aclError aclmdlExecuteAsync(uint32_t modelId, const aclmdlDataset *input, aclmdlDataset *output, aclrtStream stream)

参数说明

参数名

输入/输出

说明

modelId

输入

指定需要执行推理的模型的ID。

调用aclmdlLoadFromFile接口/aclmdlLoadFromMem接口/aclmdlLoadFromFileWithMem接口/aclmdlLoadFromMemWithMem接口加载模型成功后,会返回模型ID。

input

输入

模型推理的输入数据。

若用户使用aclrtMallocaclrtMallocHost接口申请大块内存并自行划分、管理内存时,用户在管理内存时,模型输入数据的内存有对齐和补齐要求,首地址128字节对齐,对齐后再加32字节,然后再向上对齐到128字节。

output

输出

模型推理的输出数据。

若用户使用aclrtMalloc接口申请大块内存并自行划分、管理内存时,用户在管理内存时,模型输出数据的内存有对齐和补齐要求,首地址128字节对齐,对齐后再加32字节,然后再向上对齐到128字节。

stream

输入

指定Stream。

返回值说明

返回0表示成功,返回其它值表示失败。

参考资源