下载
中文
注册

创建训练作业

对于PyTorch模型,训练作业创建步骤如下:

提供训练部分参数配置说明样例,其他参数配置可参考《ModelArts AI 工程师用户指南》中“使用自定义镜像训练模型”章节。

  1. 登录ModelArts管理控制台,在左侧导航栏中选择“训练管理” > “训练作业” ,进入训练作业界面,如图1所示。
    图1 训练作业界面
  2. 图1所示,单击“创建训练作业”按钮,按照顺序填写以下信息,完成后单击“提交”。
    1. 训练作业基本信息:名称,描述,实验设置,如图2所示。
      图2 训练作业基本信息
    2. 设置环境信息:如图3所示。
      图3 环境信息示例
      表1 环境信息示例参数说明表

      参数信息

      说明

      创建方式

      创建方式选择 “自定义算法”。

      启动方式

      启动方式选择“自定义”。

      镜像

      镜像选择创建算法中上传好的镜像。

      启动命令

      启动命令填写:python ./modelarts/train_start.py。

      工作目录

      选择对应工作目录。

    3. 设置参数信息:如图4所示。
      图4 参数信息示例
      表2 参数信息示例参数说明表

      参数信息

      说明

      data_url

      训练数据集的obs地址。

      test_data_url

      测试数据集的obs地址。

      train_url

      训练输出obs地址。

    4. 资源设置:根据需要选择资源池、资源类型、规格与计算节点个数,设置作业日志路径,如图5所示。
      图5 资源设置示例