问题定位流程&方法

Runtime故障定位,一般采用至上而下的日志分析方法,根据业务流程逐步缩小到底层故障现象。

  1. 查看plog日志,确认host的报错信息,plog日志路径为:/root/ascend/log/debug/plog/plog-pid_yyyymmddtttttttt.log。

    系统默认为ERROR级别的日志,如果需要更详细的日志,可以使用 export ASCEND_GLOBAL_LOG_LEVEL=0 或者export ASCEND_GLOBAL_LOG_LEVEL=1开启DEBUG或者INFO级别的日志。

    注意:通过上面命令行方式,环境变量仅生效于执行界面,并且在需要重新执行任务才生效。

  2. 查看device日志,确认device的报错信息。

    使用/usr/local/Ascend/driver/tools/msnpureport命令将device侧收集日志到host侧,然后进行查看。