pull_blocks
函数功能
PagedAttention场景下,根据BlocksCacheKey,通过block列表的方式从对端节点拉取Cache到本地Cache。
函数原型
pull_blocks(self, src_cache_key: Union[CacheKey, CacheKeyByIdAndIndex, BlocksCacheKey], dst_cache: Cache, src_blocks: Optional[Union[Tuple[int], List[int]]] = (), dst_blocks: Union[Tuple[int], List[int]] = ()
参数说明
参数名称 |
数据类型 |
取值说明 |
---|---|---|
src_cache_key |
Union[CacheKey, CacheKeyByIdAndIndex, BlocksCacheKey] |
远端的Cache索引。 |
dst_cache |
目标Cache。 |
|
src_blocks |
Optional[Union[Tuple[int], List[int]]] |
远端的block index列表, src_cache_key不是BlocksCacheKey时,不填。 |
dst_blocks |
Union[Tuple[int], List[int]] |
本地的block index列表。 |
调用示例
from llm_datadist import * ... cache_manager.pull_blocks(blocks_cache_key, cache, [0, 1], [2, 3])
约束说明
无
父主题: CacheManager