收集进程卡住问题信息
支持用户手动收集、工具自动收集两种方式。
- 用户手动收集:收集Host、Device日志文件,仅收集最小集信息。
- 工具自动收集:在Host服务上,使用asys工具收集所有故障相关信息,包括安装版本信息、Device健康状态信息、dump文件、算子编译信息、全量日志文件等。
注意:asys工具使用场景有限,集群、容器、虚拟机、云场景不支持asys工具一键式收集故障信息。
用户手动收集方法:
收集Host侧应用类日志、trace日志等,详细步骤如下:
- 在Host服务器规划一个存放日志的目录,例如${HOME}/err_log_info/。
- Host侧应用类日志的默认路径为Host服务器的${HOME}/ascend/log目录。将日志文件拷贝至err_log_info目录下:
mv ${HOME}/ascend/log ${HOME}/err_log_info/
- trace日志的默认路径为Host服务器的$HOME/ascend/atrace/目录。将日志文件拷贝至err_log_info目录下:
mv $HOME/ascend/atrace ${HOME}/err_log_info/
关于日志级别、日志路径以及日志文件的详细介绍请参见《日志参考》。
工具自动收集方法
asys工具的使用约束请参见asys工具功能及约束,在使用asys工具前需先安装、配置asys工具,请先参见asys工具使用指导(EP模式)处的前提条件说明。
asys工具命令示例如下,执行asys collect命令,收集故障信息:
asys collect [--output="path"]
output表示收集信息所存放的目录,详细参数说明及约束请参见故障信息收集。
父主题: 进程卡住问题定位专题