下载
EN
注册

使用说明

产生机制

用户执行模型构建、推理运行、训练脚本等场景时发生异常错误,例如检查到输入错误(命令行输入参数错误、API输入参数错误、输入文件错误、算子不支持、Shape/Format不支持……)、环境错误,此时通过调用REPORT_INPUT_ERROR()、REPORT_EVN_ERROR()等接口函数,在用户界面展示报错的错误码信息。

错误码展示方式说明

错误码以6位字符形式体现,例如E10035,其中:
  • 第1位表示级别,分为E、W、I,分别表示错误、告警、提示类。
  • 第2位表示模块
    • 1:GE
    • 2:FE
    • 3:AI CPU
    • 4:TE Fusion
    • 7:Vector算子插件
    • 8:Vector算子
    • B:TBE Pass编译工具
    • C:Auto Tune
    • D:RLTune
    • E:Runtime
    • F:LxFusion&AutoDeploy
    • G:AOE
    • H:AscendCL
    • I:HCCL
    • J:HCCP
    • K:Profiling
    • L:Driver
    • M:队列调度
    • N:DVPP
    • O:AMCT
    • Z:算子公共错误码
  • 剩下4位表示错误码,0000~8999为用户类错误,9000~9999为内部错误码。

由于场景不同、用例不同、发生故障的原因不同,造成打印的错误码信息有区别,因此,本文中以[%s]变量形式替代实际的打印日志,[%s]替代的实际日志以屏幕打印为准。例如E10035错误码在手册中的表示形式为:

E10035: The [--dynamic_batch_size], [--dynamic_image_size], or [--dynamic_dims] argument has [%s] profiles, which is less than the minimum [%s].

用户界面实际报错示例如下,会增加PID和时间戳:

E10035: [PID: xxxxxx] 时间戳 The [--dynamic_batch_size], [--dynamic_image_size], or [--dynamic_dims] argument has [1] profiles, which is less than the minimum [2].

  • 异步任务执行场景下,例如连续下发多个算子执行任务,可能会有多个算子报错,错误信息中可能包含多个算子错误,用户需从首报错算子开始排查问题。
  • 一般情况下,E*9***表示系统内部错误码,内部错误码需要联系华为进行故障排查。您可以获取日志后单击Link联系技术支持。
  • 本文介绍的错误码相关信息已在屏显报错时全部展示,包括可能的原因、解决方案等,因此,本处仅将相关内容罗列供参考。