通过msnpureport工具导出Device侧系统日志失败
2023/05/08
180
问题信息
问题来源 | 产品大类 | 产品子类 | 关键字 |
---|---|---|---|
官方 | 模型训练 | TensorFlow | 日志、落盘 |
问题现象描述
通过msnpureport工具导出Device侧系统日志失败,日志没有落盘。
解决措施
执行排查和恢复操作。
- 在Host侧执行msnpureport工具命令后,查看打印的提示信息定位问题。
若未能解决问题,请执行步骤2。
- 在Host侧和Device侧分别执行如下命令查看Host侧日志存放路径(运行msnpureport工具所在路径)和Device侧日志落盘路径(“/var/log/npu/slog”)所在的磁盘空间是否已满。(用户需要有登录Device侧的权限)
df -h
若未能解决问题,请执行步骤3。
- 登录Device侧执行如下命令查看adda进程是否存在。(用户需要有登录Device侧的权限)
ps -elf | grep adda
若返回如下图所示信息,说明adda进程存在。
图1 adda进程信息 - 若Device侧adda进程不存在,在Device侧执行如下步骤手动启动adda进程。
- 执行如下命令切换到普通用户(如HwHiAiUser)。
su HwHiAiUser
- 执行如下命令手动启动adda进程。
nohup /var/adda > /dev/null 2>&1 &
- 执行如下命令确认adda进程是否被启动。
ps -elf | grep adda
- 执行如下命令切换到普通用户(如HwHiAiUser)。
本页内容