在模型运行时遇到报错“Inner Error xxxx”,但打印的堆栈报错信息与实际错误无关

报错信息

报错截图举例:

问题分析

NPU模型训练时默认为异步运行,因此打印出的堆栈报错与实际错误并不一致。如果想要打印出与实际错误相对应的堆栈报错信息,需要修改环境变量将运行模式改为同步运行。

处理方法

修改环境变量TASK_QUEUE_ENABLE为0:

export TASK_QUEUE_ENABLE=0

再次运行模型,即可得到与实际错误一致的堆栈报错信息。