迁移总体思路
通用模型迁移适配方法,可以分为四个阶段:迁移分析、模型迁移、精度调试与性能调优,总体流程如下图所示。

本手册的内容是根据迁移阶段与其对应任务设计的,如表1所示。
迁移阶段 |
迁移任务 |
任务描述 |
---|---|---|
模型选取与约束说明 |
|
|
迁移支持度分析 |
|
|
模型脚本迁移 |
通过模型脚本迁移,实现GPU -> NPU的接口替换、NPU分布式框架改造。 |
|
环境变量和脚本配置 |
|
|
关键特性适配 |
|
|
模型调试 |
|
|
模型保存与导出 |
参考模型保存与导出用于在线或离线推理。
|
|
精度分析与调优 |
|
|
性能数据采集与评测 |
||
模型性能优化实施 |
依据性能瓶颈模块的类型,从性能调优方法寻求优化方法,具体方法包括数据加载优化、NPU亲和适配优化、内存优化、通信优化和调度优化。 此外,本章节还提供了通信优化的建议和可以使能的通信算法,以及调度优化方法。 |