尽量一次搬运较大的数据块
【优先级】高
【描述】搬运不同大小的数据块时,对带宽的利用率(有效带宽/理论带宽)不一样。根据实测经验,单次搬运数据长度16KB以上时,通常能较好地发挥出带宽的最佳性能。因此对于单次搬运,应考虑尽可能的搬运较大的数据块。下图展示了某款AI处理器上实测的不同搬运数据量下带宽的变化图。

测试数据与处理器型号相关,且实际测试时可能会存在略微抖动,具体带宽数值并不一定和下文的测试数据严格一致。
图1 UB->GM方向不同搬运数据量下实际占用带宽的变化

图2 GM->UB方向不同搬运数据量下实际占用带宽的变化

父主题: 搬运优化