执行训练脚本拉起训练进程,例如:
(以下参数为举例,用户可根据实际情况自行改动)
python3 main.py /home/data/resnet50/imagenet --batch-size 128 \ # 训练批次大小,请尽量设置为处理器核数的倍数以更好的发挥性能 --lr 0.1 \ # 学习率 --epochs 90 \ # 训练迭代轮数 --arch resnet50 \ # 模型架构 --world-size 1 \ --rank 0 \ --workers 40 \ # 加载数据进程数 --momentum 0.9 \ # 动量 --weight-decay 1e-4 \ # 权重衰减 --gpu 0 # device号, 这里参数名称仍为gpu, 但迁移完成后实际训练设备已在代码中定义为npu