下载
中文
注册

CacheDesc

函数功能

构造CacheDesc。

函数原型

CacheDesc(num_tensors: int, shape: Union[Tuple[int], List[int]], data_type: DataType, placement: Placement, batch_dim_index: int=0, seq_len_dim_index: int=-1, kv_tensor_format: str=None)

参数说明

参数名称

数据类型

取值说明

num_tensors

int

cache中tensor的个数,操作cache时,所有tensor会做同样的操作。

shape

Union[Tuple[int], List[int]]

tensor的shape。

data_type

DataType

tensor的data type。

placement

Placement

表示cache所在的设备类型。默认值Placement.DEVICE。

batch_dim_index

int

表示shape中batch size所在维度。默认值0,表示在第0维。

seq_len_dim_index

int

表示shape中seq_len所在维度。默认值-1,表示未配置。

kv_tensor_format

str

表示cache的format。默认不配置,在check_capacity时使用。

调用示例

from llm_datadist import CacheDesc
cache_desc = CacheDesc(80, [4, 2048, 1, 128], DataType.DT_FLOAT16)

返回值

正常场景下无返回值。

传入数据类型错误情况下会抛出TypeError或ValueError异常。

约束说明