文档
注册

操作步骤

MindStudio执行模型训练的主要步骤包括:

  1. 创建训练工程(首次执行训练)/导入训练工程(已存在训练工程)
  2. 运行配置
  3. 执行训练

前提条件

  • 当工程选择为MindSpore工程或样例时,需参见MindSpore官方网站安装页面进行运行环境的搭建。
  • 当工程选择为TensorFlow工程或样例时,需确保进行模型训练的运行环境(本地环境或远程环境)中已安装框架插件包Ascend-cann-tfplugin_xxx.run,安装方式请参见CANN 6.3.RC1 软件安装指南安装开发环境 > 在昇腾设备上安装 > 安装框架插件包章节。
  • 当工程选择为PyTorch工程或样例时,需安装PyTorch框架及混合精度模块,安装方式请参见CANN 6.3.RC1 PyTorch网络迁移和训练指南的“环境准备”章节。

创建训练工程

当前支持以MindSporeTensorFlowPyTorch训练框架为模板创建训练工程,其中MindSpore可以使用MindInsight组件实现训练过程可视化,MindInsight详细配置请参见MindInsight训练可视化

  1. 进入训练工程创建界面,训练工程界面如图1所示。
    • MindStudio欢迎界面:单击“New Project”,进入创建工程界面。
    • MindStudio工程界面:在顶部菜单栏中选择File > New > Project...,进入创建工程界面。
    图1 创建工程界面
  2. 创建训练工程。
    1. 在左侧导航栏选择“Ascend Training”,如图1所示。
      1. 在右侧界面选择“CANN Version”
      2. 选择“Templates”下不同框架工程或选择“Samples”下内置样例,这里选择的为“Templates”下的框架工程。
        • 当选择“Templates”下的工程时,需要用户自行准备训练脚本:
          • 若为NPU训练脚本,可直接进行模型训练;
          • 若为GPU训练脚本,需要将脚本通过分析迁移转换为NPU训练脚本,再进行模型训练;
        • 当选择“Samples”下的NPU训练工程样例时,可直接进行模型训练。
    2. 单击“Next”,配置训练工程其他信息,参数说明如表1所示。
      表1 工程参数说明

      参数

      说明

      Project name

      工程名称,自行配置。

      • 名称开头和结尾必须是数字或字母。
      • 只能包含字母、数字、中划线和下划线。
      • 长度不超过64个字符。

      Project location

      工程默认保存路径,用户可自定义。(对于首次使用MindStudio的用户,该项默认为$HOME/MindstudioProjects”。)

      More settings

      “Module name”:模块名,默认与“Project name”一致。

      “Content root”:根目录下路径。

      “Module file location”:模块文件路径。

      单击“Project format”右侧选框,出现下拉菜单。
      • .idea(directory-based):创建项目的时候创建一个.idea的项目录来保存项目的信息,默认选项。
      • .ipr(file-based):项目配置文件来保存项目的配置信息。
    3. 单击“Finish”完成训练工程的创建。
      若工作窗口已打开其他工程,会出现确认提示。
      • 选择“This Window”,则直接在当前工作窗口打开新创建的工程。
      • 选择“New Window”,则新建一个工作窗口打开新创建的工程。
  3. 查看训练工程目录结构和主要文件,请以实际创建结果为准。
    ├── .idea
    ├── data                                  //数据集目录,需用自行创建
    ├── .project                                 //工程信息文件,包含工程类型、工程描述、运行目标设备类型以及CANN版本
    ├── train.py                                //训练脚本文件,为空文件,用户在这里编写训练脚本
    ├── MyTraining.iml                         

导入训练工程

如果已有训练工程,则无需新建训练工程,可直接通过MindStudio导入,操作如下。

  1. 使用MindStudio导入训练工程。
    • MindStudio欢迎界面:单击“Open”,选择需要导入的工程,单击“OK”确认导入。
    • MindStudio工程界面:在顶部菜单栏中选择File > Open...或单击工具栏中的,选择现有工程打开。
      • 如该工程存在代码风险,在打开时会弹出信任窗口。
        • 如该工程源码可被信任且安全,请单击“Trust Project”。(可通过勾选“Trust project in <工作区目录>复选框信任该目录下的所有工程。)
        • 如该工程不被信任,仅用于查看其中源码,请单击“Preview in Safe Mode”进入安全模式预览。
        • 如放弃打开该工程,请单击“Don't Open”取消工程导入操作。
      • 若导入NPU训练工程,可直接进行模型训练;若导入GPU训练工程,需要将脚本通过分析迁移转换为NPU训练脚本,再进行模型训练。
  2. 若工作窗口已打开其他工程,会出现确认提示。
    • 选择“This Window”,则直接在当前工作窗口打开新创建的工程。
    • 选择“New Window”,则新建一个工作窗口打开新创建的工程。
  3. 成功导入工程后,工程目录以树状呈现,请以实际创建结果为准。

    如果导入的是非昇腾工程,需要将工程转换为昇腾工程,再进行运行配置,详情请参见工程转换

运行配置

  1. 单击工程界面Run > Edit Configurations...或单击图2所示菜单中的Edit Configurations... ,进入运行配置界面。
    图2 快捷方式进入运行配置界面
  2. 配置训练参数。
    • “Run Mode”若选择“Remote Run”,则配置界面如图3所示。
      图3 运行配置界面
    • “Run Mode”若选择“Local Run”,则配置界面如图4所示。
      图4 运行配置界面

    在右侧配置训练工程运行信息,配置示例如表2所示。

    表2 训练工程运行信息

    参数

    说明

    Name

    工程名称,用户自行配置,必选。

    • 名称必须以字母开头,数字或字母结尾。
    • 只能包含字母、数字、中划线和下划线。
    • 长度不能超过64个字符。

    Run Mode

    运行环境选择。选择“Remote Run”“Local Run”,默认为“Remote Run”

    Executable

    训练工程中的执行入口文件,必选。

    例如:/data/home/xxx/MindstudioProjects/MyTraining/xxx

    Deployment

    运行配置。选择Remote Run模式时可见,必选。

    请参见Ascend Deployment进行配置,可以将指定项目中的文件、文件夹同步到远程指定机器的指定目录。

    Command Arguments

    训练工程执行参数,可选。

    Environment Variables

    训练工程环境变量,可选。

  3. 单击OK完成训练工程信息的创建。

执行训练

  1. 单击工程界面Run > Run 'MyTraining'或单击图5所示菜单,执行训练。
    图5 快捷方式执行训练
  2. 查看训练结果。
    • 训练成功:在工程界面底部Run窗口显示运行实时信息,如图6 运行实时信息所示。
      图6 运行实时信息
    • 训练失败,在工程根目录下的“out/reports”下生成训练工程的整网支持度报告network_analysis_timestamp.report。报告内容如图7 整网支持度报告所示。
      图7 整网支持度报告

      图7 整网支持度报告是以MindSpore训练框架创建的训练工程,训练失败后在工程根目录下的“out/reports”下生成的.report文件;以TensorFlow和PyTorch训练框架创建的训练工程,训练失败后生成的.report文件返回至用户自定义的输出路径。

搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词