收集内存OOM问题信息
支持用户手动收集、工具自动收集两种方式。
- 用户手动收集:收集Host、Device日志文件,仅收集最小集信息。
- 工具自动收集:在Host服务上,使用asys工具收集所有故障相关信息,包括安装版本信息、Device健康状态信息、dump文件、算子编译信息、全量日志文件等。
注意:asys工具使用场景有限,集群、容器、虚拟机、云场景不支持asys工具一键式收集故障信息。
用户手动收集方法
收集Host侧应用类日志、Device侧系统类日志,详细步骤如下:
- 在Host服务器规划一个存放日志的目录,例如${HOME}/err_log_info/。
- Host侧应用类日志的默认路径为Host服务器的${HOME}/ascend/log目录。将日志文件拷贝至err_log_info目录下:
mv ${HOME}/ascend/log ${HOME}/err_log_info/
- Device侧系统类日志(包括slog日志、syslog日志、黑匣子等)通过使用msnpureport工具导出到Host侧:
# 在${HOME}/err_log_info目录下一个存放Device日志的目录 cd ${HOME}/err_log_info mkdir report # 在report目录下执行msnpureport命令 cd report Driver安装目录/driver/tools/msnpureport -f
工具自动收集方法
asys工具的使用约束请参见asys工具功能及约束,在使用asys工具前需先安装、配置asys工具,请先参见asys工具使用指导(EP模式)处的前提条件说明。
asys工具命令示例如下,执行asys collect命令,收集故障信息:
asys collect [--output="path"]
output表示收集信息所存放的目录,详细参数说明及约束请参见故障信息收集。
父主题: 内存OOM问题定位专题