核函数NPU上板精度验证
NPU调测支持一键PIPE_ALL等调试功能,更多功能介绍和全量参数说明参见NPU调测功能。
- 执行如下命令进行核函数NPU上板验证。
ascendebug kernel --backend npu --repo-type minimalist --json-file ${op_config_json_file} --core-type ${core_type} --block-num 4
命令参数
参数含义
取值说明
--backend
Kernel调测类型。
NPU上板精度校验时填写npu。
--repo-type
算子开发工程场景类型。
核函数直调场景固定配置为minimalist。
--json-file
算子信息配置文件。
具体参见输入配置中的json配置文件。
--core-type
算子类型。
根据实际情况填写,可选值为{AiCore, MixCore, CubeCore, VectorCore, MixVectorCore},MixVectorCore为预留参数,开发者无需关注。本场景以AddCustom算子为例,配置为VectorCore。
--block-num
设置运行Kernel时起的核数。
缺省为1。取值必须与代码逻辑匹配,否则会影响运行结果。
- 根据打屏日志“Gen data compare result file”描述信息查看精度比对结果文件,判断精度是否异常。结果文件详情参见“NPU调测功能 > 调测产物”。
父主题: 精度调试