aclmdlExecuteAsync
函数功能
执行模型推理,异步接口。
约束说明
- 对同一个modelId的模型,不能调用aclmdlExecuteAsync接口执行多Stream并发场景下的模型推理。错误示例如下,该示例中,两次aclmdlExecuteAsync接口多Stream并发执行,导致报错:
//...... aclmdlExecuteAsync(modelId1, input, output, stream1); aclmdlExecuteAsync(modelId1, input, output, stream2); aclrtSynchronizeStream(stream1); aclrtSynchronizeStream(stream2); //......
- 对同一个modelId的模型,由于与模型关联的资源(例如stream、内存等)唯一,因此不能在多线程中并发使用,否则,可能导致业务异常。
- 模型加载、模型执行、模型卸载的操作必须在同一个Context下(关于Context的创建请参见aclrtCreateContext)。
函数原型
aclError aclmdlExecuteAsync(uint32_t modelId, const aclmdlDataset *input, aclmdlDataset *output, aclrtStream stream)
参数说明
参数名 |
输入/输出 |
说明 |
---|---|---|
modelId |
输入 |
指定需要执行推理的模型的ID。 调用aclmdlLoadFromFile接口/aclmdlLoadFromMem接口/aclmdlLoadFromFileWithMem接口/aclmdlLoadFromMemWithMem接口加载模型成功后,会返回模型ID。 |
input |
输入 |
模型推理的输入数据。 若用户使用aclrtMalloc或aclrtMallocHost接口申请大块内存并自行划分、管理内存时,用户在管理内存时,模型输入数据的内存有对齐和补齐要求,首地址128字节对齐,对齐后再加32字节,然后再向上对齐到128字节。 |
output |
输出 |
模型推理的输出数据。 若用户使用aclrtMalloc接口申请大块内存并自行划分、管理内存时,用户在管理内存时,模型输出数据的内存有对齐和补齐要求,首地址128字节对齐,对齐后再加32字节,然后再向上对齐到128字节。 |
stream |
输入 |
指定Stream。 |
返回值说明
返回0表示成功,返回其它值表示失败。
参考资源
- 接口调用流程,参见Callback场景。
- 接口调用示例,参见异步推理+callback回调处理。
父主题: 模型加载与执行