简介
ascend-log-collect.sh用于在故障分析定位时收集运行环境信息、昇腾NPU健康信息、昇腾软件日志、Device的系统级日志和MindX日志。收集到的数据以tar.gz格式保存。收集的tar.gz日志包解压后可以得到system-report.log.gz、ascend-report.log.gz、ascend_user_log.tar.gz(此日志存在才会收集到)、ascend_user_install_log.tar.gz和device_log.tar.gz;此外,若存在Device日志,会得到YYYY-MM-DD-HH-MM-SS文件夹;若存在边缘设备的日志,还会得到alog.tar.gz、plog.tar.gz;若指定了需要收集的SDK日志的路径,还会得到mindx_sdk_info_*.tar.gz。
日志收集功能收集的日志可能包含系统信息,请用户注意日志导出后使用过程中的信息扩散风险。
- 运行环境信息(system-report.log.gz)包含以下内容:
- 操作系统信息,通过读取“/etc/lsb-release”和“/etc/os-release”文件获取。
- PCIe设备信息,通过执行lspci命令获取。
- 系统软件包信息,通过执行apt list/rpm -qa命令获取。
- Python软件包信息,通过执行pip list/pip3 list命令获取。
- 固件版本与系统版本信息。
/usr/local/Ascend/driver/tools/upgrade-tool --device_index -1 --component -1 --version
查询系统版本:
/usr/local/Ascend/driver/tools/upgrade-tool --device_index -1 --system_version
其中/usr/local/Ascend为driver的安装路径,通过查询/etc/ascend_install.info文件获取。
- 环境变量信息,通过执行env命令获取。
- 启动文件的权限信息,通过执行ls -l /boot命令获取。
- 内存状态信息,通过执行cat /proc/meminfo命令获取。
- CPU状态信息,通过执行cat /proc/cpuinfo命令获取。
- 中断报告文件,通过执行cat /proc/interrupts命令获取。
- 槽位信息,通过执行dmidecode -t slot命令获取。
- 系统上次启动的时间,通过执行last reboot命令获取。
- 昇腾NPU健康信息(ascend-report.log.gz)包含以下内容:
- 昇腾软硬件版本信息、昇腾软件安装信息。
- Ascend-DMI版本信息、拓扑检测、设备健康状态等信息,通过执行ascend-dmi相关命令获取,请参考ascend-dmi工具使用。
- 芯片相关信息,通过执行npu-smi相关命令获取。
- Host的系统级日志
- ascend_user_log.tar.gz:收集的昇腾软件日志,主要是CANN应用类日志,分为Host侧和Device侧应用程序产生的日志。
- Host侧运行应用程序产生的日志位于“${HOME}/ascend/log/plog”目录。
- Device侧运行应用程序产生的日志位于“${HOME}/ascend/log/device-<id>”目录。
- ascend_user_install_log.tar.gz:CANN安装日志。其中root用户安装日志位于“/var/log/ascend_seclog”,非root用户存放于“${HOME}/var/log/ascend_seclog”下。
- device_log.tar.gz:收集到的昇腾软硬件日志。包含的目录为“/var/log/npu”。
- YYYY-MM-DD-HH-MM-SS文件夹:Device的系统级日志,把Device侧日志打包到Host当前目录的日志包中。
- alog.tar.gz:边缘设备中间件(MindX Edge等)的日志。
- plog.tar.gz:边缘设备管理OM的日志。
- 收集的SDK相关信息(mindx_sdk_info_*.tar.gz)包含:
芯片信息(版本和日志)、操作系统版本信息、环境变量、网络信息以及MindX SDK信息(版本、配置文件、日志、第三方库版本)等。
父主题: 日志收集工具使用