操作步骤
MindStudio执行模型训练的主要步骤包括:创建训练工程(首次执行训练)/导入训练工程(已存在训练工程)>运行配置>执行训练。
创建训练工程
当前支持以MindSpore、TensorFlow和PyTorch训练框架为模板创建训练工程。
- 进入训练工程创建界面,训练工程界面如图1所示。
- MindStudio欢迎界面:单击“New Project”,进入创建工程界面。
- MindStudio工程界面:在顶部菜单栏中选择 ,进入创建工程界面。
- 创建训练工程。
- 在左侧导航栏选择“Ascend Training”,如图1所示。
- 在右侧界面选择“CANN Version”。
- 选择“Templates”下不同框架工程或选择“Samples”下内置样例,这里选择的为“Templates”下的框架工程。
当选择“Templates”下的工程时,需要导入或自行编写训练脚本,若为NPU训练脚本,可直接进行模型训练;若为GPU训练脚本,需要将脚本通过分析迁移转换为NPU训练脚本,再进行模型训练;当选择“Samples”下的NPU训练工程样例时,可直接进行模型训练。
- 单击“Next”,配置训练工程其他信息,参数说明如表1所示。
表1 工程参数说明 参数
说明
Project name
工程名称,自行配置。
名称开头和结尾必须是数字或字母。只能包含字母、数字、中划线和下划线,且长度不超过64个字符。
Project location
工程默认保存路径,用户可自定义。(对于首次使用MindStudio的用户,该项默认为“$HOME/MindstudioProjects”。)
More settings
“Module name”:模块名,默认与“Project name”一致。
“Content root”:根目录下路径。
“Module file location”:模块文件路径。
单击“Project format”右侧选框,出现下拉菜单。- .idea(directory-based):创建项目的时候创建一个.idea的项目录来保存项目的信息,默认选项。
- .ipr(file-based):项目配置文件来保存项目的配置信息。
- 单击“Finish”完成训练工程的创建。
若工作窗口已打开其他工程,会出现确认提示。
- 选择“This Window”,则直接在当前工作窗口打开新创建的工程。
- 选择“New Window”,则新建一个工作窗口打开新创建的工程。
- 在左侧导航栏选择“Ascend Training”,如图1所示。
- 查看训练工程目录结构和主要文件,请以实际创建结果为准。
├── .idea ├── data //数据集目录,需用自行创建 ├── .project //工程信息文件,包含工程类型、工程描述、运行目标设备类型以及CANN版本 ├── train.py //训练脚本文件,为空文件,用户在这里编写训练脚本 ├── MyTraining.iml
导入训练工程
如果已有训练工程,则无需新建训练工程,可直接通过MindStudio导入,操作如下。
- 使用MindStudio导入训练工程。
- MindStudio欢迎界面:单击“Open”,选择需要导入的工程,单击“OK”确认导入。
- MindStudio工程界面:在顶部菜单栏中选择 或单击工具栏中的,选择现有工程打开。
- 如该工程存在代码风险,在打开时会弹出信任窗口。
- 如该工程源码可被信任且安全,请单击“Trust Project”。(可通过勾选“Trust project in <工作区目录>”复选框信任该目录下的所有工程。)
- 如该工程不被信任,仅用于查看其中源码,请单击“Preview in Safe Mode”进入安全模式预览。
- 如放弃打开该工程,请单击“Don't Open”取消工程导入操作。
- 若导入NPU训练工程,可直接进行模型训练;若导入GPU训练工程,需要将脚本通过分析迁移转换为NPU训练脚本,再进行模型训练。
- 如该工程存在代码风险,在打开时会弹出信任窗口。
- 若工作窗口已打开其他工程,会出现确认提示。
- 选择“This Window”,则直接在当前工作窗口打开新创建的工程。
- 选择“New Window”,则新建一个工作窗口打开新创建的工程。
- 成功导入工程后,工程目录以树状呈现,请以实际创建结果为准。
运行配置
- 单击工程界面图2所示菜单中的 ,进入运行配置界面。 或单击
- 配置训练参数。
在右侧配置训练工程运行信息,配置示例如表2所示。
表2 训练工程运行信息 参数
说明
备注
Name
工程名称,用户自行配置。
例如:MyTraining
名称必须以字母开头,数字或字母结尾,只能包含字母、数字、中划线和下划线,且长度不能超过64个字符。
Run Mode
运行环境选择。选择“Remote Run”或“Local Run”,默认为“Remote Run”。
-
Executable
训练工程中的执行入口文件。
例如:
/data/home/xxx/MindstudioProjects/MyTraining/train.py
-
Deployment
运行配置。选择Remote Run模式时可见,必选配置。
通过Deployment功能,详细请参见Deployment,可以将指定项目中的文件、文件夹同步到远程指定机器的指定目录。
Command Arguments
训练工程执行参数,可选配置。
-
Environment Variables
训练工程环境变量,可选配置。
-
- 单击 完成训练工程信息的创建。
执行训练
- 单击工程界面图5所示菜单,执行训练。训练执行过程:连接远端训练机器 > 打包训练工程发布到远端训练机器 > 启动训练工程执行。 或单击
- 执行训练后,在工程界面底部 窗口显示运行实时信息,如下图:图6 运行实时信息
- 如果训练成功,打印训练成功信息。如果训练失败,在工程根目录下的out/reports下生成训练工程的整网支持度报告network_analysis_timestamp.report。报告内容如下:图7 整网支持度报告
此整网支持度报告是以MindSpore训练框架创建的训练工程,训练失败后在工程根目录下的out/reports下生成的.report文件;以TensorFlow和PyTorch训练框架创建的训练工程,训练失败后生成的.report文件返回至用户自定义的输出路径。