文档
注册

NPU调测参数

参数(区分大小写)

说明

是否必选

默认值

备注

kernel

开启NPU调测功能的固定参数。

-b,--backend

算子调试类型。

npu

NPU调测场景设为npu。

  • cpu:CPU调测场景。
  • npu:NPU调测场景。
  • simulator:仿真器调测场景。

--chip-version

昇腾AI处理器的版本。

工具自动获取对应版本。

支持手动设置。在安装昇腾AI处理器的服务器执行npu-smi info命令进行查询,在查询到的“Name”前增加Ascend信息,例如“Name”对应取值为xxxyy,实际配置的值为Ascendxxxyy

说明:

若用户在没有Device的环境下调试算子,该参数必须指定。

当前chip-version支持以下取值:
  • Atlas 推理系列产品(Ascend 310P处理器)参数值:Ascend310P1、Ascend310P3。
  • Atlas A2训练系列产品参数值:AscendxxxB1、AscendxxxB2、AscendxxxB3、AscendxxxB4。

-i,--install-path

CANN软件安装后文件存储路径

工具自动获取CANN包安装路径,缺省值为/usr/local/Ascend。

例如,若安装的Ascend-cann-toolkit软件包,则安装后文件存储路径为:$HOME/Ascend/ascend-toolkit。

-w,--work-dir

调测结果的存放路径。

缺省值为当前执行路径下的debug_workspace文件夹(若无则会新建)。

调测工作目录,可用于存放调测中各种临时文件、结果文件。

-j,--json-file

算子信息json配置文件,配置算子输入/输出/属性信息。

json配置文件必须是绝对路径,其配置项说明详见数据准备与配置说明

--log-level

日志级别。

info

支持debug 、info、warning、error级别。

--log-file

日志文件路径。

缺省值为当前目录下的debug_op.log文件(若无则会新建)。

根据设置的--log-level存放程序执行过程中的日志信息。

--repo-type

算子开发场景类型。

customize

根据实际情况设置。

  • minimalist:核函数直调工程场景。
  • customize:标准自定义算子工程。
  • cann_dev:预留的built-in算子工程场景,开发者无需关注。
  • op_contrib:预留的内源框架工程场景,开发者无需关注。

--customize-path

自定义算子包的安装目录。

例如${cann_install_path}/latest/opp/vendors/${vendor_name},其中${cann_install_path}为CANN软件安装包路径,${vendor_name}为部署自定义算子包时设置的vendor名。

说明:

当--repo-type为customize,该参数才生效。

--dump-mode

printf/PRINTF/DumpTensor/DumpAccChkPoint/assert打印功能的模式。

若不设置表示关闭打印功能,若开启支持如下取值:

  • normal: 使能通用的打印功能。
  • acc_chk:使能偏移位置打印Tensor(DumpAccChkPoint功能)。

更多打印功能说明参见Debug调试功能

--rel-err-thd

精度比对的相对误差阈值。

0.005

--abs-err-thd

精度比对的绝对误差阈值。

0.005

--tiling-bin

使用用户传入的tiling.bin进行编译。

传入的Tiling bin是带绝对路径的文件名,文件命名规则为tiling_data_tiling_key_${tiling_key}_block_dim_${block_num}_workspace_${workspace}.bin,确保tiling_key、block_num、workspace与Tiling bin文件匹配。

--tiling-so

使用用户传入的liboptiling.so进行编译。

该参数与--tiling-bin冲突,若设置了--tiling-bin,本参数不生效。

--block-num

设置运行的核个数。

如果有tiling bin文件,则使用其对应的block_num值,否则根据实际情况自行配置。

--core-type

算子类型。

AiCore

根据实际算子情况填写,可选值为AiCore、MixCore、CubeCore、VectorCore、MixVectorCore,MixVectorCore为预留参数,开发者无需关注。

-d,--device-id

设置运行的device id。

0

--pipe-all

自动插入PIPE_ALL功能,无需配置值。

--profiling

Profiling功能开关,无需配置值。

  • 基础功能:无需配置,默认采集PipeUtilization数据(pmu数据)。
  • 高级功能:支持采集多种运行性能数据,可通过--profiling ${profiling_metrics}设置,${profiling_metrics}取值如下:
  • Atlas 推理系列产品(Ascend 310P处理器):ArithmeticUtilization、PipeUtilization(默认值)、Memory、MemoryL0、MemoryUB、ResourceConflictRatio
  • Atlas A2训练系列产品:ArithmeticUtilization、PipeUtilization(默认值)、Memory、MemoryL0、MemoryUB、ResourceConflictRatio、L2Cache

更详细的功能说明参见Profiling数据采集功能

--loop

当使能Profiling时,设置上板执行次数。

10

-t,--timeout

设置运行超时时间,单位秒。

600

--kernel-bin

指定已编译好的kernel bin文件。

当该参数生效时,会跳过编译流程,直接用指定的kernel bin文件执行。

--tiling-json

Tiling json文件路径(绝对路径),用于生成自定义Tiling data。

预留参数项,开发者无需关注。

--repo-path

源码仓所在根目录(绝对路径)。

--recompile-tiling

使用源码仓重新编译算子tiling so库文件的功能开关,无需配置值。

--npu-compile-type

设置NPU调测场景下.o文件编译方式。

opc

--syncall

硬同步功能的使能开关,无需配置值。

--task-ration

设置核函数运行时的block数分配方式比例,例如“--task-ration 1:1”。

搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词