下载
中文
注册

学习向导

描述本手册的读者对象,TensorFlow 2.6.5模型开发的全流程,以及使用本手册的一些注意点。

读者对象

本文档适用于AI算法工程师,将基于TensorFlow 2.6.5的Python API开发的训练脚本迁移到昇腾AI处理器上执行训练,并达到训练精度性能最优。

掌握以下经验和技能可以更好地理解本文档:
  • 熟悉CANN软件基本架构以及特性。
  • 熟练的Python语言编程能力。
  • 熟悉TensorFlow的API
  • 对机器学习、深度学习有一定的了解,熟悉训练网络的基本知识与流程。

支持的产品型号

Atlas 训练系列产品

Atlas A2 训练系列产品

使用前须知

  • 昇腾AI处理器进行模型迁移之前,建议用户事先准备好基于TensorFlow 2.6.5开发的训练模型以及配套的数据集,并要求在GPU或CPU上跑通,精度收敛,且达到预期精度和性能要求。同时记录相关精度和性能指标,用于后续在昇腾AI处理器进行精度和性能对比。
  • 本文中的代码片段仅为示例,请用户使用时注意修改适配。

模型开发流程

模型开发的主要工作就是将TensorFlow原始模型迁移到昇腾AI处理器上并执行训练,主要流程如下图所示。

图1 模型开发流程

迁移方式比较

将基于TensorFlow的Python API开发的训练脚本迁移到昇腾AI处理器上执行训练,目前有两种迁移方式,用户可任选其一:

  • 自动迁移

    算法工程师通过迁移工具,可自动分析出原生的TensorFlow Python API在昇腾AI处理器上的支持度情况,同时将原生的TensorFlow训练脚本自动迁移成昇腾AI处理器支持的脚本,对于无法自动迁移的API,可以参考工具输出的迁移报告,对训练脚本进行相应的适配修改。

  • 手工迁移

    算法工程师通过自行修改TensorFlow训练脚本,以支持在昇腾AI处理器上执行训练,该种方式较为复杂,建议优先使用自动迁移方式。

相关课程

您可以访问Link获取TensorFlow 2.6.5模型迁移和训练的在线视频课程。