文档
注册

使用向导

使用说明

本手册详细介绍了Ascend C算子调测工具的安装、调测流程和调测功能等,并提供命令行和API两种方式,以指导用户在不同场景下对Ascend C算子发起Tiling、精度、性能调测。

  • 使用Ascend C算子调测工具前,请先熟悉Ascend C自定义算子开发指南手册,了解算子开发、算子调用、算子调试调优等内容。
  • 对于离线推理/训练场景中的算子推荐使用命令行方式调测,对于在线推理/训练场景中的算子推荐使用API方式调测。
表1 手册向导

使用场景

操作指引

说明

1. Ascend C算子调测工具是什么

调测工具简介

阐述了工具的基本概念、关键调测功能、调测方式和流程等,帮助用户快速了解和使用工具。

2. 使用算子调测工具前,如何搭建基础环境

环境准备

阐述了工具软件的获取、安装、环境变量设置和依赖项安装等。

3a. 调测工具如何进行算子调测(通过命令行)

标准自定义算子工程场景的算子调测示例

针对典型场景,提供命令行方式进行算子调测的快速上手示例。调测功能包括Tiling调测、CPU孪生调试、NPU上板打印 、自动精度比对、上板Profiling数据采集、性能仿真流水图等。

核函数直调工程场景的算子调测示例

ops_adv工程场景的算子调测示例

3b. 调测工具如何进行算子调测(通过API)

标准自定义算子工程场景的算子调测示例

针对典型场景,提供API方式进行算子调测的快速上手示例。调测功能包括Tiling调测、CPU孪生调试、NPU上板打印 、自动精度比对、上板Profiling数据采集、性能仿真流水图等。

核函数直调工程场景的算子调测示例

ops_adv工程场景的算子调测示例

4. 算子调测过程中涉及哪些配置和调测功能

数据准备与配置说明

阐述命令行和API两种方式下算子调测需要的输入/标杆数据算子信息json文件配置等。

Tiling调测功能

阐述了命令行和API两种方式下算子如何进行Tiling计算,并介绍相应调测产物。

CPU调测功能

阐述了命令行和API两种方式下算子如何在CPU侧编译运行,并介绍精度比对结果,帮助用户快速定位代码问题。

NPU调测功能

阐述了命令行和API两种方式下算子如何在NPU板端编译运行,并介绍精度比对结果,帮助验证实际算子精度是否正常。

Profiling数据采集功能

阐述了命令行和API两种方式下算子NPU上板调测时如何开启Profiling数据采集功能,并介绍了解析结果,方便定位软、硬件性能瓶颈。

Simulator性能仿真功能

阐述了命令行和API两种方式下算子如何基于CAModel进行仿真并生成指令流水图,帮助深入分析算子性能瓶颈。

Debug调试功能

阐述了命令行和API两种方式下算子调测过程中支持的调试功能,包括printf/PRINTF、DumpTensor、assert等打印功能。

5. 想了解更多调测相关的命令行参数

命令行参数说明

针对命令行方式,本章根据调测功能提供了对应的全量参数说明,帮助用户快速掌握命令行参数含义和功能。

6. 想了解更多调测相关的API接口

Python API接口说明

针对API方式,本章详细介绍了ascendebug模块一系列关于调测API接口,帮助用户快速掌握接口含义和功能。

7. 使用工具调试调优算子时,遇到问题怎么办

FAQ

工具调测过程中难免会出现异常或报错场景。本章罗列了一些高频问题,给出了具体的原因分析和处理措施。

使用约束

  • 本手册仅支持对静态Shape算子调测,暂不支持动态Shape算子调测。
  • 本工具当前支持的产品型号:
    • Atlas A2训练系列产品/Atlas 800I A2推理产品
    • Atlas 推理系列产品(Ascend 310P处理器)
    • Atlas 200/500 A2推理产品
搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词