概述
PyTorch作为当前深度学习领域中广泛采用的框架之一,经过Ascend Extension for PyTorch对昇腾平台的兼容性适配,现已支持在昇腾平台上进行高效训练。
本手册的主要目标是指导具有一定PyTorch模型训练基础的用户将原本在其他平台(例如GPU)上训练的模型迁移到昇腾平台(NPU)。
手册内容涵盖模型全流程的迁移方法:无论是针对小模型还是大模型,都提供了详尽的指导。主要关注点是如何有效地将PyTorch训练模型迁移至昇腾平台上高性能运行。
本手册面向的读者主要是具有一定深度学习基础与编程经验的研究人员、工程师和开发者:
- 了解深度学习的基本概念和技术,能够使用Python编程语言、PyTorch框架进行深度学习模型开发和调试;
- 对深度学习模型的训练和优化有一定的了解,包括训练任务执行与评估,分布式训练,性能数据采集及分析等;
- 对常见的系统性能优化手段有基本认知,例如并行化、编译优化等。
什么是模型迁移
将原本设计用于GPU或其他三方平台的深度学习模型训练代码,经过模型代码修改等适配操作,来适应NPU的架构和编程,让模型能在NPU上进行高性能运行。
为什么要做模型迁移
在将模型从其他三方平台迁移到NPU时,由于硬件架构和库的不同,涉及到一系列底层到上层的适配操作。以GPU为例,模型迁移至NPU需要适配的原因可分为三方面:
如何进行模型迁移
本手册端到端给出了模型迁移流程指南,具体请参考迁移总体思路章节。