下载
中文
注册

运行流程

命令行方式

若采用工具命令行方式对单算子调测,其运行流程如图1所示。

图1 基于命令行的工具运行流程
  1. 准备环境:使用本工具进行算子调测前,请先完成基础环境搭建,详细操作参见环境准备
  2. 准备数据:准备好bin格式的输入数据和标杆数据文件,该数据是调测工具的必要输入。
  3. 配置json文件:根据工具提供的算子信息json配置样例配置待测算子信息,该文件是调测工具的必要输入。
  4. 通过命令行方式发起算子调测。

    目前工具支持的算子调测能力如下,请按需选择:

    • Tiling调测:对Tiling函数调测,生成Tiling结果,验证Tiling函数功能。
    • 精度调试:通过CPU仿真或者NPU上板进行核函数精度调试,支持自动精度比对、printf/PRINTF/DumpTensor/assert打印等功能。
    • 性能调优:通过采集算子上板Profiling性能数据或者通过CAModel获取算子性能仿真流水,辅助分析算子性能瓶颈。

为方便用户更好地理解并使用Ascend C调测工具,本手册提供了不同算子开发场景下通过命令行进行调测的样例,样例如下:

API方式

若采用工具API方式对单算子调测,其运行流程如图2所示。

图2 基于API的工具运行流程
  1. 准备环境:使用本工具进行算子调测前,请先完成基础环境搭建,详细操作参见环境准备
  2. 准备数据:准备好输入数据和标杆数据文件,该数据是调测工具的必要输入。
  3. 通过API方式发起算子调测。

    目前工具支持的算子调测能力如下,请按需选择:

    • Tiling调测:对Tiling函数进行调测,生成Tiling结果,验证Tiling函数功能。
    • 精度调试:通过CPU仿真或者NPU上板进行核函数精度调试,支持自动精度比对、printf/PRINTF/DumpTensor/assert打印等功能。
    • 性能调优:通过采集算子上板Profiling性能数据或者通过CAModel获取算子性能仿真流水,辅助分析算子性能瓶颈。

为方便用户更好地理解并使用Ascend C调测工具,本手册提供了不同算子开发场景下通过API进行调测的样例,样例如下: