下载
中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助
昇腾小AI

NPU调测参数

参数(区分大小写)

说明

是否必选

默认值

备注

kernel

开启NPU调测功能的固定参数。

-b,--backend

算子调试类型。

npu

NPU调测场景设为npu。

  • cpu:CPU调测场景。
  • npu:NPU调测场景。
  • simulator:仿真器调测场景。

--chip-version

昇腾AI处理器的版本。

工具自动获取对应版本。

支持手动设置。在安装昇腾AI处理器的服务器执行npu-smi info命令进行查询,在查询到的“Name”前增加Ascend信息,例如“Name”对应取值为xxxyy,实际配置的值为Ascendxxxyy

若用户在没有Device的环境下调试算子,该参数必须指定。

-i,--install-path

CANN软件安装后文件存储路径

工具自动获取CANN包安装路径,缺省值为/usr/local/Ascend/ascend-toolkit

例如,若安装的Ascend-cann-toolkit软件包,则安装后文件存储路径为:$HOME/Ascend/ascend-toolkit/latest。

-w,--work-dir

调测结果的存放路径。

缺省为当前执行路径下/debug_workspace/${op_type}文件夹(若无则会自动新建)。

调测工作目录,可用于存放调测中各种临时文件、结果文件。例如/home/debug_workspace/AddCustom/npu。

-j,--json-file

算子信息json配置文件,配置算子输入/输出/属性信息。

json配置文件必须是绝对路径,其配置项说明详见数据准备与配置说明

--log-level

日志级别。

info

支持debug 、info、warning、error级别。

--log-file

日志文件路径。

缺省值为当前目录下的debug_op.log文件(若无则会新建)。

根据设置的--log-level存放程序执行过程中的日志信息。

--repo-type

算子开发场景类型。

customize

根据实际情况设置。

  • minimalist:核函数直调工程场景。
  • customize:标准自定义算子工程。
  • ops_adv:cann-ops-adv算子工程。
  • cann_dev:预留的built-in算子工程场景,开发者无需关注。
  • op_contrib:预留的内源框架工程场景,开发者无需关注。

--customize-path

自定义算子包的安装目录。

例如${INSTALL_DIR}/opp/vendors/${vendor_name},其中${INSTALL_DIR}为CANN安装包路径,${vendor_name}为部署自定义算子包时设置的vendor名。

说明:

仅当--repo-type为customize,该参数生效。

--dump-mode

printf/PRINTF/DumpTensor/DumpAccChkPoint/assert/时间戳打印功能的模式。

若不设置表示关闭打印功能,若开启支持如下取值:

  • normal: 使能通用的打印功能。
  • acc_chk:使能偏移位置打印Tensor(DumpAccChkPoint功能)。
  • time_stamp:时间戳打点功能。(Atlas A2训练系列产品/Atlas 800I A2推理产品
说明:

当取值为normal、acc_chk时,不支持与--profiling同时开启。

更多打印功能介绍参见更多功能

--core-type

算子类型。

AiCore

根据实际算子情况填写,可选值为AiCore、MixCore、CubeCore、VectorCore、MixVectorCore,MixVectorCore为预留参数,开发者无需关注。

--rel-err-thd

精度比对的相对误差阈值。

0.005

--abs-err-thd

精度比对的绝对误差阈值。

0.005

-d,--device-id

设置运行的device id。

0

-t,--timeout

设置运行超时时间,单位秒。

600

--block-num

设置运行的核个数。

如果有Tiling bin文件,则使用其对应的block_num值,否则根据实际情况自行配置。

--pipe-all

自动插入PIPE_ALL功能,无需配置值。

--profiling

Profiling功能开关,无需配置值。

  • 基础采集:无配置值,默认采集PipeUtilization数据(pmu数据)。
  • 高级采集:支持采集多种运行性能数据,可通过--profiling ${profiling_metrics}设置,${profiling_metrics}取值如下:
    • Atlas 200/300/500 推理产品:ArithmeticUtilization、PipeUtilization(默认值)、Memory、MemoryL0、MemoryUB、ResourceConflictRatio
    • Atlas 200/500 A2推理产品:ArithmeticUtilization、PipeUtilization、Memory、MemoryL0、MemoryUB、ResourceConflictRatio、L2Cache、PipelineExecuteUtilization(默认值)
    • Atlas 推理系列产品:ArithmeticUtilization、PipeUtilization(默认值)、Memory、MemoryL0、MemoryUB、ResourceConflictRatio
    • Atlas 训练系列产品:ArithmeticUtilization、PipeUtilization(默认值)、Memory、MemoryL0、MemoryUB、ResourceConflictRatio
    • Atlas A2训练系列产品/Atlas 800I A2推理产品:ArithmeticUtilization、PipeUtilization(默认值)、Memory、MemoryL0、MemoryUB、ResourceConflictRatio、L2Cache
说明:

与--dump-mode中normal、acc_chk参数冲突,不支持同时开启。

更详细的功能说明参见Profiling数据采集功能

--loop

当使能Profiling时,设置上板执行次数。

10

--kernel-bin

指定已编译好的Kernel bin文件。

当该参数生效时,会跳过编译流程,直接用指定的kernel bin文件执行。

--tiling-bin

使用用户传入的Tiling.bin进行编译。

传入的Tiling bin是带绝对路径的文件名,文件命名规则为tiling_data_tiling_key_${tiling_key}_block_dim_${block_num}_workspace_${workspace}.bin,确保tiling_key、block_num、workspace与Tiling bin文件匹配。

说明:

该参数与--tiling-so、--tiling-json、--recompile-tiling冲突,不支持同时设置。

--tiling-so

使用用户传入的liboptiling.so进行编译。

该参数与--tiling-bin、--tiling-json、--recompile-tiling冲突,不支持同时设置。

--tiling-json

Tiling json文件路径(绝对路径),用于生成自定义Tiling data。

仅当--repo-type为ops_adv、cann_dev,该参数生效。

说明:

该参数与--tiling-so、--tiling-bin、--recompile-tiling冲突,不支持同时设置。

--repo-path

算子源码仓所在路径(绝对路径)。

仅当--repo-type为ops_adv、cann_dev、op_contrib,该参数生效。

--recompile-tiling

是否重新编译算子Tiling so,无需配置值。

  • 若设置了,默认根据算子源码仓重新编译Tiling so。
  • 若未设置,工具自动查找CANN包下的so文件,开发者无需关注。
说明:
  • 仅当--repo-type为ops_adv、cann_dev、op_contrib,该参数才生效。
  • 该参数与--tiling-so、--tiling-bin、--tiling-json冲突,不支持同时设置。

--npu-compile-type

设置调测场景下Kernel.o文件编译方式。

opc

当--repo-type为cann_dev、ops_adv时支持ccec和opc两种编译方式,minimalist默认使用ccec,customize、op_contrib默认使用opc。

  • opc:Ascend C框架自带的编译方式。
  • ccec:本工具基于毕昇编译器自动拼接编译选项得到的编译方式,毕昇编译器介绍参见毕昇编译器使用指南

--syncall

硬同步功能的使能开关,无需配置值。

当--repo-type为ops_adv、cann_dev且--npu-compile-type为ccec时,该参数在Atlas A2训练系列产品/Atlas 800I A2推理产品上才生效。

--task-ration

设置核函数运行时的block数分配方式比例,例如“--task-ration 1:1”。

当--repo-type为ops_adv、cann_dev且--npu-compile-type为ccec时,该参数才生效。

--memory-check

是否开启内存检测功能。

  • 未设置:默认关闭。
  • oom:开启内存异常检测,主要检测内存泄漏、非法释放、非法读写、越界访问。(仅支持Atlas A2训练系列产品/Atlas 800I A2推理产品
  • oob:开启内存异常检测,主要检测越界访问。(支持Atlas A2训练系列产品/Atlas 800I A2推理产品Atlas 推理系列产品
说明:
  • 与--dump-mode参数冲突,不支持同时开启。
  • 仅当--repo-type为cann_dev、customize、ops_adv,且--npu-compile-type为opc时,该参数生效。
搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词