TPosition
Ascend C管理不同层级的物理内存时,用一种抽象的逻辑位置(TPosition)来表达各级别的存储,代替了片上物理存储的概念,达到隐藏硬件架构的目的。主要的TPosition类型包括:VECIN、VECOUT、VECCALC、A1、A2、B1、B2、CO1、CO2,其中VECIN、VECCALC、VECOUT主要用于矢量编程,A1、A2、B1、B2、CO1、CO2用于矩阵编程。您可以参考编程范式了解TPosition的基础概念,通过表1了解TPosition和物理存储的映射关系。
TPosition定义如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 |
enum class TPosition : uint8_t { GM, A1, A2, B1, B2, C1, C2, CO1, CO2, VECIN, VECOUT, VECCALC, LCM = VECCALC, SPM, SHM = SPM, TSCM, C2PIPE2GM, C2PIPE2LOCAL, MAX, }; |
TPosition枚举值的具体定义如下:
枚举值 |
具体含义 |
---|---|
GM |
Global Memory,对应AI Core的外部存储。 |
VECIN |
用于矢量计算,搬入数据的存放位置,在数据搬入Vector计算单元时使用此位置。 |
VECOUT |
用于矢量计算,搬出数据的存放位置,在将Vector计算单元结果搬出时使用此位置。 |
VECCALC |
用于矢量计算/矩阵计算,在计算需要临时变量时使用此位置。 |
A1 |
用于矩阵计算,存放整块A矩阵,可类比CPU多级缓存中的二级缓存。 |
B1 |
用于矩阵计算,存放整块B矩阵,可类比CPU多级缓存中的二级缓存。 |
C1 |
用于矩阵计算,存放整块Bias矩阵,可类比CPU多级缓存中的二级缓存。 |
A2 |
用于矩阵计算,存放切分后的小块A矩阵,可类比CPU多级缓存中的一级缓存。 |
B2 |
用于矩阵计算,存放切分后的小块B矩阵,可类比CPU多级缓存中的一级缓存。 |
C2 |
用于矩阵计算,存放切分后的小块Bias矩阵,可类比CPU多级缓存中的一级缓存。 |
CO1 |
用于矩阵计算,存放小块结果C矩阵,可理解为Cube Out。 |
CO2 |
用于矩阵计算,存放整块结果C矩阵,可理解为Cube Out。 |
SPM |
当Unified Buffer内存有溢出风险时,用于Unified Buffer的数据暂存。 |
TSCM |
Temp Swap Cache Memory, 用于临时把数据交换到额外空间,进行Matmul运算。 |
C2PIPE2GM |
用于存放FIXPIPE量化参数。 |
C2PIPE2LOCAL |
预留参数。为后续的功能做保留,开发者暂时无需关注。 |