文档
注册

1P训练任务测试

类别

训练任务。

项目名称

单节点1个NPU的训练任务。

硬件环境

Atlas 800 训练服务器(型号9000)Atlas 800 训练服务器(型号9010)

训练框架

MindSpore。

模型

ResNet-50(下载地址)。

测试组网

请参见组网方案进行组网。

预置条件

  1. 已完成驱动、固件和CANN软件安装。
  2. 已完成MindX DL集群环境部署。集群环境正常且NPU资源充足。
  3. 训练镜像、数据集和训练脚本存在。

测试步骤

以下操作均在深度学习平台上完成:

  1. 创建训练任务,选择1个NPU,训练框架选择MindSpore,选择模型对应的数据集。
  2. 在任务列表中查看当前任务状态是否正常运行。
  3. 在训练过程中通过界面查看NPU信息。
  4. 任务结束后检查是否生成模型文件,并查看训练任务日志和FPS信息。

预期结果

  1. 任务创建成功。
  2. 训练任务成功运行,服务器上有1个NPU被占用。
  3. AI Core利用率能达到80%。
  4. 训练任务结束后生成模型文件,FPS数据在2200左右。

执行结果

请提供预期结果中的每个步骤的操作结果截图。

搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词