下载
中文
注册

工具部署

工具简介

一键式精度分析工具,提供了对训练网络进行精度分析的常用功能,主要包括:

该工具封装了TF Adapter的运行参数,帮助用户更方便的使能相关业务特性,同时对CANN Toolkit包中的精度分析工具进行了封装和功能扩展,从而帮助开发人员快速分析精度问题。

使用约束

  • 当前该工具仅支持TensorFlow 1.15和TensorFlow 2.6训练场景,TensorFlow 1.15下的精度调优请参考TensorFlow 1.15模型迁移指南
  • 不能同时采集溢出数据和精度数据。
  • 采集溢出数据或精度数据时,都可能会产生较多结果文件,导致磁盘空间不足,请适当控制迭代次数。

工具部署

https://gitee.com/ascend/tools下载precision_tool文件夹,上传到训练工作目录下,无需安装。目录结构示例:
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
├── resnet                              // 训练工作目录
    ├── __init__.py     
    ├── imagenet_main.py              // 基于Imagenet数据集训练网络模型
    ├── imagenet_preprocessing.py     // Imagenet数据集数据预处理模块
    ├── resnet_model.py               // resnet模型文件
    ├── resnet_run_loop.py            // 数据输入处理与运行循环(训练、验证、测试)
    ├── cifar10_main                  // 训练执行入口文件
    ├── ...
    ├── precision_tool           // 一键式精度分析工具目录
        ├── cli.py                   
        ├── ...
  • 如果CANN开发/运行环境合一部署,只需将precision_tool文件夹,上传到训练工作目录下即可。
  • 如果CANN开发/运行环境独立部署,需要将precision_tool文件夹上传到CANN运行环境的训练工作目录下,同时将precision_tool上传到CANN开发环境的任意目录下。

    CANN运行环境(包含昇腾AI处理器,即启动NPU训练的环境),在训练精度调优工作中,主要用于训练时精度数据采集;

    CANN开发环境(即安装CANN Toolkit软件的环境),在训练精度调优工作中,主要用于精度数据分析。

典型使用流程

图1 CANN开发/运行环境合一部署
图2 CANN开发/运行环境独立部署