使用场景
典型场景
:开启混合精度进行一般模型训练的场景。
梯度累加场景
:每计算一个batch的梯度,进行梯度的累加而不是清零,当累加到一定次数再更新参数、清零梯度的场景。
多Models,Losses,and Optimizers场景
:神经网络中同时存在多个损失函数和优化器的场景。
DDP场景(one NPU per process)
:在分布式训练中,一个进程在一个NPU上运行的场景。
目前针对PyTorch1.8.1框架仅支持以上4种场景,更多场景使用请参考
官方文档
。
父主题:
AMP使用说明