设置请求类型,prefill或decode。
void SetReqType(mindie_llm::InferReqType reqType);
参数 |
是否必选 |
说明 |
取值要求 |
---|---|---|---|
reqType |
是 |
请求类型。 |
|
mindie_llm::InferRequestId runtimeReqId(0); std::shared_ptr<mindie_llm::InferRequest> runtimeRequest(runtimeReqId); runtimeRequest->SetReqType(mindie_llm::InferReqType::REQ_STAND_INFER);
无。