内存建模与优化

内存建模

最常见的大模型结构为Transformer结构,该结构由Attention和FFN两个子层组成,如图1所示:

图1 结构图

计算量和参数量如图2所示:

图2 计算量和参数量

参数缩写如图3所示:

图3 参数缩写表图

模型参数量如图4所示:

图4 模型参数量表图

内存开销如图5所示:

图5 内存开销表图

片上内存上总的内存占用为: 96h^2L + 104hL + 8(v+s)h + 34bshL + 5abLs^2

内存优化

常用内存优化手段如下: