下载
中文
注册

CapacityState

函数功能

check_capacity接口的返回值,表示内存情况。

函数原型

CapacityState(is_available: bool, free_tokens_num: int, total_tokens_num: int) -> None

参数说明

参数名称

数据类型

取值说明

is_available

bool

表示内存是否足够。false时,表示没有足够空间缓存kv cache,如果继续调用predict,会有oom报错。

free_tokens_num

int

空闲token的数量。

total_tokens_num

int

token的总数量。

调用示例

from llm_datadist import LLMDataDist, LLMRole
llm_datadist = LLMDataDist(LLMRole.PROMPT, 0)
...
llm_req = LLMReq()
llm_req.prompt_length = 1
capacity_state = llm_datadist.check_capacity(llm_req.prompt_length)
print(capacity_state)

返回值

约束说明