准备工作
为了便于比较和定位精度问题,需要做好以下准备工作:
- 固定随机种子,消除随机差异,确保对比可复现。
- 在NPU和GPU上加载完全一致的预训练权重。若没有预训练权重,可以使GPU先训练若干step,并保存权重,然后NPU和GPU加载该权重,重新开始训练,以此确保初始权重一致。
- workloader设置为0。
- dataloader的shuffle设置为false。
- dropout关闭(最快捷的办法是,将其概率值设置为0)。
- 确保模型迁移的脚本正确(尽可能将NPU的修改同步到GPU上,观察GPU是否也存在问题)。
父主题: 精度异常定位