NPU调测参数
参数(区分大小写) |
说明 |
是否必选 |
默认值 |
备注 |
---|---|---|---|---|
kernel |
开启NPU调测功能的固定参数。 |
是 |
无 |
无 |
-b,--backend |
算子调试类型。 |
否 |
npu |
NPU调测场景设为npu。
|
--chip-version |
昇腾AI处理器的版本。 |
否 |
工具自动获取对应版本。 |
支持手动设置。在安装昇腾AI处理器的服务器执行npu-smi info命令进行查询,在查询到的“Name”前增加Ascend信息,例如“Name”对应取值为xxxyy,实际配置的值为Ascendxxxyy。
若用户在没有Device的环境下调试算子,该参数必须指定。 |
-i,--install-path |
CANN软件安装后文件存储路径。 |
否 |
工具自动获取CANN包安装路径,缺省值为/usr/local/Ascend。 |
例如,若安装的Ascend-cann-toolkit软件包,则安装后文件存储路径为:$HOME/Ascend/ascend-toolkit。 |
-w,--work-dir |
调测结果的存放路径。 |
否 |
缺省值为当前执行路径下的debug_workspace文件夹(若无则会新建)。 |
调测工作目录,可用于存放调测中各种临时文件、结果文件。 |
-j,--json-file |
算子信息json配置文件,配置算子输入/输出/属性信息。 |
是 |
无 |
json配置文件必须是绝对路径,其配置项说明详见数据准备与配置说明。 |
--log-level |
日志级别。 |
否 |
info |
支持debug 、info、warning、error级别。 |
--log-file |
日志文件路径。 |
否 |
缺省值为当前目录下的debug_op.log文件(若无则会新建)。 |
根据设置的--log-level存放程序执行过程中的日志信息。 |
--repo-type |
算子开发场景类型。 |
否 |
customize |
根据实际情况设置。
|
--customize-path |
自定义算子包的安装目录。 |
否 |
无 |
例如${INSTALL_DIR}/opp/vendors/${vendor_name},其中${INSTALL_DIR}为CANN安装包路径,${vendor_name}为部署自定义算子包时设置的vendor名。
说明:
仅当--repo-type为customize,该参数生效。 |
--dump-mode |
printf/PRINTF/DumpTensor/DumpAccChkPoint/assert打印功能的模式。 |
否 |
无 |
若不设置表示关闭打印功能,若开启支持如下取值:
说明:
与--profiling参数冲突,不支持同时开启。 更多打印功能说明参见Debug调试功能。 |
--core-type |
算子类型。 |
否 |
AiCore |
根据实际算子情况填写,可选值为AiCore、MixCore、CubeCore、VectorCore、MixVectorCore,MixVectorCore为预留参数,开发者无需关注。 |
--rel-err-thd |
精度比对的相对误差阈值。 |
否 |
0.005 |
无 |
--abs-err-thd |
精度比对的绝对误差阈值。 |
否 |
0.005 |
无 |
-d,--device-id |
设置运行的device id。 |
否 |
0 |
无 |
-t,--timeout |
设置运行超时时间,单位秒。 |
否 |
600 |
无 |
--block-num |
设置运行的核个数。 |
否 |
无 |
如果有Tiling bin文件,则使用其对应的block_num值,否则根据实际情况自行配置。 |
--pipe-all |
自动插入PIPE_ALL功能,无需配置值。 |
否 |
无 |
无 |
--profiling |
Profiling功能开关,无需配置值。 |
否 |
无 |
说明:
与--dump-mode参数冲突,不支持同时开启。 更详细的功能说明参见Profiling数据采集功能。 |
--loop |
当使能Profiling时,设置上板执行次数。 |
否 |
10 |
无 |
--kernel-bin |
指定已编译好的Kernel bin文件。 |
否 |
无 |
当该参数生效时,会跳过编译流程,直接用指定的kernel bin文件执行。 |
--tiling-bin |
使用用户传入的Tiling.bin进行编译。 |
否 |
无 |
传入的Tiling bin是带绝对路径的文件名,文件命名规则为tiling_data_tiling_key_${tiling_key}_block_dim_${block_num}_workspace_${workspace}.bin,确保tiling_key、block_num、workspace与Tiling bin文件匹配。
说明:
该参数与--tiling-so、--tiling-json、--recompile-tiling冲突,不支持同时设置。 |
--tiling-so |
使用用户传入的liboptiling.so进行编译。 |
否 |
无 |
该参数与--tiling-bin、--tiling-json、--recompile-tiling冲突,不支持同时设置。 |
--tiling-json |
Tiling json文件路径(绝对路径),用于生成自定义Tiling data。 |
否 |
无 |
仅当--repo-type为ops_adv、cann_dev,该参数生效。
说明:
该参数与--tiling-so、--tiling-bin、--recompile-tiling冲突,不支持同时设置。 |
--repo-path |
算子源码仓所在路径(绝对路径)。 |
否 |
无 |
仅当--repo-type为ops_adv、cann_dev、op_contrib,该参数生效。 |
--recompile-tiling |
是否重新编译算子Tiling so,无需配置值。 |
否 |
无 |
说明:
|
--npu-compile-type |
设置调测场景下Kernel.o文件编译方式。 |
否 |
opc |
当--repo-type为cann_dev、ops_adv时支持ccec和opc两种编译方式,minimalist默认使用ccec,customize、op_contrib默认使用opc。 |
--syncall |
硬同步功能的使能开关,无需配置值。 |
否 |
无 |
当--repo-type为ops_adv、cann_dev且--npu-compile-type为ccec时,该参数在Atlas A2训练系列产品/Atlas 800I A2推理产品上才生效。 |
--task-ration |
设置核函数运行时的block数分配方式比例,例如“--task-ration 1:1”。 |
否 |
无 |
当--repo-type为ops_adv、cann_dev且--npu-compile-type为ccec时,该参数才生效。 |
--memory-check |
是否开启内存检测功能。 |
否 |
无 |
当前主要针对Atlas A2训练系列产品/Atlas 800I A2推理产品的NPU调测场景下oom内存进行越界检测。同时与--dump-mode参数冲突,不支持同时开启。
说明:
|