下载
中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助
昇腾小AI

CPU调测功能

功能介绍

  • 如果用户需要快速进行代码逻辑调试,可优先选择算子CPU调测。使用通用的打印、gdb调测手段,快速定位代码问题。
  • 在NPU板端上板运行之前,可优先选择算子CPU调测初步定位算子精度问题,提高算子NPU上板成功率。

CPU调测主要基于用户输入,生成编译所需的bin文件,自动执行算子CPU编译和运行。

  • 自动精度比对:若用户配置了标杆数据(golden数据),工具会自动将实际调测运行结果与标杆数据进行精度比对。
  • 内存校验和异常检测:通过--npucheck或CpuOptions.npucheck配置项开启,一旦开启不允许进行Debug调试功能
  • printf/PRINTF功能:支持打印Scalar数据,如常量、字符串等信息。
  • DumpTensor功能支持打印Tensor数据。
  • assert功能:支持断言打印,当核函数代码中某个条件为假,则中断运行流程并打印相关信息。

使用方法(命令行)

  1. 完成环境搭建,并准备好输入/标杆数据文件。
  2. 执行如下命令进行CPU调测,这里仅提供关键参数项,其余参数请参考CPU调测参数按需设置。
    ascendebug kernel --backend cpu --json-file ${op_config_json_file} --repo-type ${repo_type} --chip-version ${chip_version} --core-type ${core_type} --install-path ${cann_install_path} --work-dir ${work_dir} ... {其他参数}

    CPU调测涉及的所有参数可通过ascendebug kernel -hascendebug kernel --help查看。

  3. 查看调测产物。核函数CPU调测后的结果文件存放在--work-dir目录下,详细说明参见调测产物

使用方法(API)

  1. 完成环境搭建,并准备好输入/标杆数据文件。

    核函数直调工程场景下,需提前配置好核函数源码信息OpKernelInfo

  2. 构建算子信息。调用DebugOp类里input系列接口(如tensor_input、custom_input等),设置算子的输入、输出、属性值等信息。
  3. 创建调试对象并初始化工作空间。调用create_op_executor接口,创建调试对象op_executor,用户可传入${work_dir}参数手动设置工作空间。
  4. (可选)调用Tiling调测接口run_custom_tiling生成Tiling Info文件。

    本步骤仅适用于标准自定义算子工程且没有Tiling Info文件的场景,需调用Tiling调测API生成Tiling Info。

  5. 调用编译运行接口run_custom_cpurun_call_kernel_cpu,在CPU上仿真运行核函数,完成输出数据精度比对。
  6. 查看调测产物。核函数CPU调测后的结果文件存放在${work_dir}目录下,详细说明参见调测产物

调测产物

无论是命令行方式或API方式,CPU调测结果均存放在${work_dir}/${op_type}/cpu路径下,包含src、build、output三个文件子目录。目录结构示例如下,精度比对结果文件的说明参见表1

  • ${work_dir}是调测工作空间,缺省时为当前路径下的debug_workspace文件夹(若无会自动新建)。
  • ${op_type}是调测算子名,本章以AddCustom为例。
├ AddCustom(算子名)
├── cpu
│   ├── build(存放CPU编译生成的中间文件)
│       ├── xxx_cpu  (CPU编译生成的算子可执行程序)
│       ├── npuchk   (npucheck结果文件存放路径)
│   ├── output(存放CPU编译运行的输出文件及精度比对结果)
│       ├── y.bin   (运行输出原始数据)
│       ├── y.txt   (精度比对结果文件)
│   ├── src(存放CPU编译生成的临时代码文件)
│       ├── CMakeLists.txt
│       ├── data_definition.txt
│       ├── add_custom_main.cpp
│       ├── add_custom_tiling.h 
│       ├── _gen_kernel_add_custom.cpp
  • 检查输出文件:在output目录下,查看是否生成算子运行输出文件(bin)和精度比对文件(txt)。
  • 查看精度比对结果:
    根据精度比对文件(txt),确认算子精度比对结果。精度比对结果输出样例如下,主要展示两份数据的均值、部分误差对比以及成功/失败的最终比对结论。若结果是失败,会将最大误差的部分数据展示出来。
    data_cmp mean is -1.41e-05 data_gd mean is -1.41e-05
    split_count:2359296.0; max_diff_hd:0.1;
    ---------------------------------------------------------------------------------------
      Loop           ExpectOut        RealOut         FpDiff         RateDiff
    ---------------------------------------------------------------------------------------
    00000001         0.0395813       0.0395813       0.0000000       0.0000000
    00000002         0.0160980       0.0160980       0.0000000       0.0000000
    00000003         -0.0443420      -0.0443420      0.0000000       0.0000000
    00000004         -0.0847778      -0.0847778      0.0000000       0.0000000
    00000005         -0.0066605      -0.0066605      0.0000000       0.0000000
    00000006         0.0880737       0.0880737       0.0000000       0.0000000
    00000007         0.0848389       0.0848389       0.0000000       0.0000000
    00000008         0.1083374       0.1083374       0.0000000       0.0000000
    00000009         0.0838623       0.0838623       0.0000000       0.0000000
    00000010         0.0887451       0.0887451       0.0000000       0.0000000
    00000011         0.0572205       0.0572205       0.0000000       0.0000000
    00000012         0.0741577       0.0741577       0.0000000       0.0000000
    00000013         -0.0762329      -0.0762329      0.0000000       0.0000000
    00000014         -0.0957642      -0.0957642      0.0000000       0.0000000
    00000015         0.0102234       0.0102234       0.0000000       0.0000000
      ...               ...             ...             ...             ...
    ---------------------------------------------------------------------------------------
    DiffThd           PctThd          PctRlt          Result
    ---------------------------------------------------------------------------------------
    0.0050            99.50%          100.000000%     Pass
    Success Success Success Success Success
    表1 精度比对结果说明

    信息项

    说明

    data_cmp mean

    运行输出数据的均值信息。

    data_gd mean

    标杆数据的均值信息。

    split_count

    统计输出数据的个数。

    max_diff_hd

    输出数据和golden数据的最大误差值阈值。

    详细对比数据展示(部分)

    Loop(数据位置)、ExpectOut(期望输出值)、RealOut(实际输出值)、FpDiff (绝对误差值)、RateDiff(相对误差值)。

    整体对比结果展示

    DiffThd(相对误差值阈值)、PctThd (精度达标数据占比阈值)、PctRlt(实际精度达标数据占比)、Result(对比结果)。

    Error Line展示项

    若精度比对结果为Failed,会追加展示部分误差较大的数据的详细信息,信息格式与"详细对比数据展示(部分)"一致。

搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词