非连续转连续优化

原理

问题定位

在模型或训练脚本中使用了View非连续类操作,如调用了transpose、narrow、select、permute、chunk、split等框架类算子,框架会调用format_contiguous函数对其进行校验,生成一个匹配且连续的tensor。

  1. 参见Profiling数据采集及分析在训练脚本中使能profiling。
  2. 通过查看Profiling数据,如发现在非连续转连续时耗时明显,可定位至对应算子,例如图4所示,format_contigousV2为转连续算子。

    图4 大量转连续算子

优化策略