总体优化策略

当前而言,基于一键迁移的方式可以保证GPU的代码迁移到NPU上的代码修改轻量化,但站在性能优化的角度上,社区中的模型代码普遍基于GPU实现,NPU和GPU在计算原理和底层架构上存在非常大的区别,因此,有些时候我们需要进行模型层面的修改,亲和适配NPU,达到最优的性能。性能优化遵循以下大的逻辑: