下载
中文
注册

日志没有正常落盘

Ascend EP标准形态

通过msnpureport工具导出Device侧系统日志失败

如果通过msnpureport工具导出Device侧系统日志失败,请参照如下步骤处理:

  1. 在Host侧执行msnpureport工具命令后,查看打印的提示信息定位问题。

    若未能解决问题,请执行2

  2. 在Host侧执行如下命令查看Host侧日志存放路径(运行msnpureport工具所在路径)所在的磁盘空间是否已满。
    df -h

    若未能解决问题,请联系华为研发工程师,或通过https://gitee.com/ascend提交issue获取帮助。

应用类日志没有正常落盘

如果应用类日志没有正常落盘(包括“$HOME/ascend/log/”目录下plog日志和device-id日志),请参照如下步骤处理:

  1. 执行如下命令查看Host侧“/var/log/messages”文件中是否有相关的错误日志。
    aarch64架构:
    cat /var/log/messages

    x86_64架构:

    cat /var/log/syslog

    若未能解决问题,请执行2

  2. 在Host侧执行如下命令查看日志落盘路径(“$HOME/ascend/log/”)所在的磁盘空间是否已满。
    df -h

    若未能解决问题,请执行3

  3. 在Host侧通过msnpureport工具导出Device侧系统日志,查看是否有相关的错误日志。

    通过msnpureport工具导出Device侧系统日志的方法请参见msnpureport工具使用指南

  4. 如果“$HOME/ascend/log/”目录下plog日志正常落盘,而device-id日志没有正常落盘,可以查看plog日志中的错误日志信息,帮忙定位进程问题。

Ascend RC形态

应用类日志没有正常落盘

如果应用类日志没有正常落盘,请参照如下步骤处理:

  1. 执行如下命令查看应用进程依赖的动态库是否正确。
    ldd xxx

    xxx为二进制应用进程。

  2. 执行如下命令查看日志落盘路径(“/var/log/npu/slog”)所在的磁盘空间是否已满。
    df -h
  3. 执行如下命令查看slogd进程是否存在。
    ps -elf | grep slogd

    若返回slogd进程相关信息,说明slogd进程存在。

    对于Atlas 200/500 A2推理产品,若slogd进程不存在,请联系华为研发工程师,或通过https://gitee.com/ascend提交issue获取帮助。

    对于Atlas 200/300/500 推理产品,若slogd进程不存在,可以执行如下步骤尝试手动启动slogd进程。

    1. 执行如下命令切换到普通用户(如HwHiAiUser)。
      su HwHiAiUser
    2. 执行如下命令手动启动slogd进程。
      nohup /var/slogd > /dev/null 2>&1 &
    3. 执行如下命令确认slogd进程是否被启动。
      ps -elf | grep slogd
  4. 若以上均无问题,但应用类日志仍没有正常落盘,可以尝试参考重启日志进程内容处理日志进程启动异常。

系统类日志没有正常落盘

如果系统类日志没有正常落盘,请参照如下步骤处理:

  1. 执行如下命令查看相关日志进程(slogd、sklogd)是否存在。
    ps -elf | grep log

    若显示进程相关信息,说明相关日志进程已存在。

    对于Atlas 200/500 A2推理产品,若进程不存在,请联系华为研发工程师,或通过https://gitee.com/ascend提交issue获取帮助。

    对于Atlas 200/300/500 推理产品,若进程不存在,可以执行如下步骤尝试手动启动相关日志进程:

    1. 执行如下命令切换到普通用户(如HwHiAiUser)。
      su HwHiAiUser
    2. 执行如下命令手动启动相关日志进程。
      • 启动slogd进程。
        nohup /var/slogd > /dev/null 2>&1 &
      • 启动sklogd进程。
        nohup /var/sklogd > /dev/null 2>&1 &
    3. 执行如下命令确认相关日志进程是否被启动。
      ps -elf | grep log
  2. 执行如下命令查看日志落盘路径(“/var/log/npu/slog”)所在的磁盘空间是否已满。
    df -h
  3. 若以上均无问题,但系统类日志仍没有正常落盘,可以尝试参考重启日志进程内容处理日志进程启动异常。