下载
中文
注册
通过msnpureport工具导出Device侧系统日志失败

通过msnpureport工具导出Device侧系统日志失败

2023/05/08

180

暂无评分
我要评分

问题信息

问题来源产品大类产品子类关键字
官方模型训练TensorFlow日志、落盘

问题现象描述

通过msnpureport工具导出Device侧系统日志失败,日志没有落盘。

解决措施

执行排查和恢复操作。

  1. 在Host侧执行msnpureport工具命令后,查看打印的提示信息定位问题。

    若未能解决问题,请执行步骤2

  2. 在Host侧和Device侧分别执行如下命令查看Host侧日志存放路径(运行msnpureport工具所在路径)和Device侧日志落盘路径(“/var/log/npu/slog”)所在的磁盘空间是否已满。(用户需要有登录Device侧的权限)

    df -h

    若未能解决问题,请执行步骤3

  3. 登录Device侧执行如下命令查看adda进程是否存在。(用户需要有登录Device侧的权限)

    ps -elf | grep adda

    若返回如下图所示信息,说明adda进程存在。

    图1 adda进程信息

  4. 若Device侧adda进程不存在,在Device侧执行如下步骤手动启动adda进程。

    1. 执行如下命令切换到普通用户(如HwHiAiUser)。
      su HwHiAiUser
    2. 执行如下命令手动启动adda进程。
      nohup /var/adda > /dev/null 2>&1 &
    3. 执行如下命令确认adda进程是否被启动。
      ps -elf | grep adda

本页内容