文档
注册

通用约束

用户定义的Tensor在内存分配时会对起始地址进行对齐,不同scope的对齐要求如表1所示。

使用TIK数据计算和数据搬运接口时,目的操作数和源操作数地址偏移对齐要求和表1保持一致,如果TIK指令接口中已说明操作数起始地址对齐要求,则以具体指令中的说明为准。
表1 不同scope的对齐要求

scope

对齐要求

Unified Buffer

昇腾310 AI处理器,要求32Byte对齐

昇腾910 AI处理器,要求32Byte对齐

昇腾310P AI处理器AI Core,要求32Byte对齐

昇腾310P AI处理器Vector Core,要求32Byte对齐

L1 Buffer

512Byte对齐

L1OUT Buffer

float16类型数据要求512Byte对齐;float32/int32/uint32类型数据要求1024Byte对齐

Global Memory

暂无对齐要求

搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词