用户定义的Tensor在内存分配时会对起始地址进行对齐,不同scope的对齐要求如表1所示。
scope |
对齐要求 |
---|---|
Unified Buffer |
Atlas 200/300/500 推理产品,要求32Byte对齐 Atlas 训练系列产品,要求32Byte对齐 Atlas推理系列产品AI Core,要求32Byte对齐 Atlas推理系列产品Vector Core,要求32Byte对齐 Atlas A2训练系列产品,要求32Byte对齐 Atlas 200I/500 A2推理产品,要求32Byte对齐 |
L1 Buffer |
512Byte对齐 |
L1OUT Buffer |
float16类型数据要求512Byte对齐;float32/int32/uint32类型数据要求1024Byte对齐 |
Global Memory |
暂无对齐要求 |