单卡训练

执行训练脚本拉起训练进程,例如:

(以下参数为举例,用户可根据实际情况自行改动)

python3 main.py /home/data/resnet50/imagenet   --batch-size 128 \       # 训练批次大小,请尽量设置为处理器核数的倍数以更好的发挥性能
                                               --lr 0.1 \               # 学习率
                                               --epochs 90 \            # 训练迭代轮数
                                               --arch resnet50 \        # 模型架构
                                               --world-size 1 \
                                               --rank 0 \         
                                               --workers 40 \           # 加载数据进程数
                                               --momentum 0.9 \         # 动量  
                                               --weight-decay 1e-4 \    # 权重衰减
                                               --gpu 0                  # device号, 这里参数名称仍为gpu, 但迁移完成后实际训练设备已在代码中定义为npu