AllocateCache
函数功能
分配Cache。
函数原型
Status AllocateCache(const CacheDesc &cache_desc, Cache &cache);
参数说明
参数名称 |
输入/输出 |
取值说明 |
---|---|---|
cache_desc |
输入 |
Cache的描述。 |
cache |
输出 |
分配出的Cache,当该接口返回LLM_SUCCESS时有效。 |
调用示例
CacheDesc kv_desc{}; kv_desc.num_tensors = 80; kv_desc.data_type = DT_FLOAT16; kv_desc.shape = {1, 256}; Cache cache; Status ret = llm_datadist.AllocateCache(kv_desc, cache);
返回值
- LLM_SUCCESS: 成功
- LLM_PARAM_INVALID: 参数错误
- LLM_DEVICE_OUT_OF_MEMORY: Device内存不足。
- 其他:失败
约束说明
需要在Initialize接口初始化完成后调用。只支持placement为CachePlacement::kDevice的Cache申请。
父主题: LlmDataDist