概述

PyTorch作为当前深度学习领域中广泛采用的框架之一，经过Ascend Extension for PyTorch对昇腾平台的兼容性适配，现已支持在昇腾平台上进行高效训练。

本手册的主要目标是指导具有一定PyTorch模型训练基础的用户将原本在其他平台（例如GPU）上训练的模型迁移到昇腾平台（NPU）。

手册内容涵盖模型全流程的迁移方法：无论是针对小模型还是大模型，都提供了详尽的指导。主要关注点是如何有效地将PyTorch训练模型迁移至昇腾平台上高性能运行。

本手册面向的读者主要是具有一定深度学习基础与编程经验的研究人员、工程师和开发者：

将原本设计用于GPU或其他三方平台的深度学习模型训练代码，经过模型代码修改等适配操作，来适应NPU的架构和编程，让模型能在NPU上进行高性能运行。

在将模型从其他三方平台迁移到NPU时，由于硬件架构和库的不同，涉及到一系列底层到上层的适配操作。以GPU为例，模型迁移至NPU需要适配的原因可分为三方面：

计算架构差异
 CUDA（Compute Unified Device Architecture）+ CuDNN是NVIDIA GPU的并行计算框架，而CANN（Compute Architecture for Neural Networks）是华为NPU的异构计算架构。
深度学习框架差异
 为了支持NPU硬件，需要对PyTorch框架进行适配：包括适配张量运算、自动微分等功能，以便在NPU上高效执行。PyTorch正在原生支持NPU，以提供给用户更好的模型体验，实现迁移修改最小化。

本手册端到端给出了模型迁移流程指南，具体请参考迁移总体思路章节。