我要评分

文档获取效率

文档正确性

内容完整性

文档易理解

在线提单

论坛求助

昇腾小AI

RunDecoderAsync

函数功能

异步执行增量图。

函数原型

ge::Status RunDecoderAsync(const LLMReq &req, const std::vector<ge::Tensor> &inputs, ge::RunAsyncCallback callback)

参数说明

参数名	输入/输出	描述
req	输入	当前执行的请求。类型为LLMReq。
inputs	输入	计算图输入Tensor，为Host上分配的内存空间
callback	输入	回调函数。用户用来处理输出的函数

返回值

请求入队成功

异常处理

无。

约束说明

必须先做初始化和linkclusters后才能调用。

只能在LLM_OPTION_ROLE为Decoder的时候调用并且在LLM_OPTION_BATCH_MODE为auto的时候调用，否则会报错。

父主题： LLMEngine