算子输入参数的信息(shape/format等)会影响算子的性能,进而影响模型整体性能。为了使模型获得更良好的性能,可以将模型中所有的算子的输入参数信息获取至本地进行分析(dump),然后将每个算子在NPU上运行,调整算子运行时的策略,确定性能最佳的策略。
参考《AOE工具使用指南》,开启自动调优。
参考《AOE工具使用指南》中的“PyTorch训练场景下调优”章节。