OM SDK预留的告警
下表中的告警信息包括OM SDK已经实现的告警和暂未实现的预留告警,开发者可以自行实现预留的告警。
告警类型 |
告警ID |
告警名称 |
是否实现 |
告警对象 |
告警等级 |
告警描述 |
---|---|---|---|---|---|---|
温度告警 |
0x00000000 |
硬盘温度过高 |
是 |
硬盘 |
一般 |
当硬盘温度高于一般告警阈值时,产生此告警;当温度恢复到正常范围内时,此告警消失。 |
0x000E002F |
NPU温度检测异常 |
否 |
NPU |
严重 |
当NPU温度高于告警阈值时,产生此告警,当温度恢复到正常范围内时,此告警恢复。 |
|
电源告警 |
0x00110000 |
RTC时钟电池电压过低 |
否 |
RTC时钟 |
一般 |
当RTC时钟电池电压低于1.66V时,产生此告警;当RTC电池电压恢复到3.0V时,此告警消失 |
存储告警 |
0x00000001 |
硬盘寿命到期预警 |
是 |
硬盘 |
一般 |
当硬盘寿命即将到期时,产生此告警;当更换硬盘后,此告警消失。 |
0x00000002 |
硬盘不在位 |
是 |
硬盘 |
一般 |
当检测不到硬盘在位信号时,产生此告警;当检测到硬盘在位时,此告警消失。 |
|
0x00000003 |
硬盘访问阻塞 |
是 |
硬盘 |
紧急 |
当访问硬盘无响应时,产生此告警;当更换硬盘后,此告警消失。 |
|
0x00000004 |
不稳定扇区数临界预警 |
否 |
硬盘 |
严重 |
当硬盘扇区读取出现错误时,不稳定扇区计数会增加,增加到超过临界状态时产生告警;当更换硬盘后,此告警消失。 |
|
0x00000005 |
剩余备用扇区不足 |
否 |
硬盘 |
严重 |
当剩余备用扇区数量接近或已达到临界值时,将产生该告警;当更换硬盘后,此告警消失。 |
|
0x00030000 |
eMMC寿命到期预警 |
是 |
eMMC |
紧急 |
eMMC寿命即将到期。 |
|
0x00030001 |
eMMC平均写入量超标 |
否 |
eMMC |
严重 |
当eMMC连续三天的平均写入量超标时(52GB),会产生此告警;当平均写入量不超过告警门限时,此告警消失。 |
|
0x00030002 |
eMMC每日写入量超标 |
否 |
eMMC |
一般 |
当eMMC每日写入量超标时(52GB),会产生此告警;当每日写入量不超过告警门限时,此告警消失。 |
|
0x00030003 |
eMMC可用预留块不足 |
否 |
eMMC |
紧急 |
当eMMC可用预留块不足时,会产生此告警;当可用预留块充足时,此告警消失。 |
|
0x00040000 |
SD卡挂载失败 |
否 |
SD |
一般 |
当SD卡挂载失败时,产生此告警;当SD卡挂载成功时,此告警消失。 |
|
0x00040001 |
SD卡寿命到期预警 |
否 |
SD |
严重 |
当SD寿命即将到期时,产生此告警;当更换SD卡后,此告警消失。 |
|
0x00120000 |
存储设备挂载配置异常 |
是 |
eMMC/SD/USB/HDD |
严重 |
当MNT设备的挂载配置文件错误时,产生此告警;当MNT设备挂载配置文件恢复正常时,此告警消失。 |
|
0x00120001 |
存储设备分区丢失 |
是 |
eMMC/SD/USB/HDD |
严重 |
当MNT外接存储设备的分区丢失时,产生此告警;当外接存储设备的分区恢复到正常情况时,此告警消失。 |
|
0x00120002 |
存储设备丢失 |
是 |
eMMC/SD/USB/HDD |
严重 |
当MNT外接存储设备丢失时,产生此告警;当外接存储设备恢复到正常情况时,此告警消失。 |
|
0x00120003 |
存储设备挂载失败 |
是 |
eMMC/SD/USB/HDD |
严重 |
当MNT外接存储设备挂载失败时,产生此告警;当外接存储设备挂载正常时,此告警消失。 |
|
0x00120004 |
存储设备挂载点异常 |
是 |
MNT |
严重 |
当MNT外接设备的挂接点错误时,产生此告警;当外接设备的挂接点正常时,此告警消失。 |
|
0x00160000 |
目录空间满 |
是 |
eMMC/DDR |
一般 |
当该目录占用率超过85%时,会产生此告警;当占用率小于80%时,此告警消失。 |
|
NFS告警 |
0x00140000 |
NFS异常 |
是 |
NFS模块 |
严重 |
当NFS挂载状态异常时,产生此告警;当NFS挂载状态正常时,此告警消失。 |
端口告警 |
0x00090000 |
网口接收错包 |
否 |
网口 |
一般 |
当网口收到CRC错包时,产生此告警;当网口24小时未收到CRC错包时,此告警消失。 |
0x00090001 |
网口发送错包 |
否 |
网口 |
一般 |
当网口发送CRC错包时,产生此告警;当网口24小时未检测到发送CRC错包时,此告警消失。 |
|
0x00090002 |
网口链路断开 |
否 |
网口 |
一般 |
当网口link状态由up变成down时,产生此告警;当网口link状态显示up时,此告警消失。 |
|
0x00090003 |
网口设备故障 |
否 |
网口 |
一般 |
当网口无法正常访问时,产生此告警;当网口可正常访问时,此告警消失。 |
|
NPU告警 |
0x000E0000 |
操作系统内核panic |
否 |
NPU |
紧急 |
当NPU操作系统内核异常时,产生此告警;当操作系统内核正常时,此告警消失。 |
0x000E0001 |
操作系统内核OOM |
否 |
NPU |
一般 |
当NPU操作系统内核OOM(Out Of Memory)异常时,产生此告警;当操作系统恢复正常时,此告警消失。 |
|
0x000E0002 |
NPU TEE模块异常 |
否 |
NPU |
严重 |
TEE模块出现Panic,进程被停止运行。 |
|
0x000E0003 |
NPU数据异常 |
否 |
NPU |
严重 |
当NPU数据异常时,产生此告警;当数据正常时,此告警消失。 |
|
0x000E0004 |
NPU指令异常 |
否 |
NPU |
严重 |
当NPU指令异常时,产生此告警;当指令正常时,此告警消失。 |
|
0x000E0005 |
NPU PC指针错误 |
否 |
NPU |
严重 |
当PC指针异常时,产生此告警;当PC指针恢复正常时,此告警消失。 |
|
0x000E0006 |
NPU SP指针错误 |
否 |
NPU |
严重 |
当NPU激发对齐错误时,产生此告警;当数据正常时,此告警消失。 |
|
0x000E0007 |
NPU无限环回 |
否 |
NPU |
严重 |
当NPU数据无限循环时,产生此告警;当数据正常时,此告警消失。 |
|
0x000E0008 |
NPU未知异常 |
否 |
NPU |
严重 |
当NPU数据出现未知异常时,产生此告警;当数据正常时,此告警消失。 |
|
0x000E0009 |
NPU AI Core异常 |
否 |
NPU |
一般 |
当AI Core运行异常时,产生此告警;当AI Core运行正常时,此告警消失。 |
|
0x000E000A |
NPU AI Core超时 |
否 |
NPU |
一般 |
当AI Core执行算子超时时,产生此告警;当AI Core执行算子正常时,此告警消失 |
|
0x000E000B |
NPU SDMA初始化错误 |
否 |
NPU |
严重 |
当SDMA异常时,产生此告警;当SDMA恢复正常时,此告警消失。 |
|
0x000E000C |
NPU TS初始化错误 |
否 |
NPU |
严重 |
当TS子系统加载异常时,产生此告警;当TS子系统加载恢复正常时,此告警消失。 |
|
0x000E000D |
NPU TS心跳丢失 |
否 |
NPU |
严重 |
当TS心跳检测异常时,产生此告警;当TS心跳恢复正常时,此告警消失。 |
|
0x000E000E |
NPU LPM3心跳丢失 |
否 |
NPU |
严重 |
当低功耗业务软件LPM3心跳异常时,产生此告警,当心跳恢复到正常范围内时,此告警消失。 |
|
0x000E000F |
NPU LPM3启动错误 |
否 |
NPU |
紧急 |
当LPM3启动异常时,产生此告警,当启动正常时,此告警消失。 |
|
0x000E0010 |
NPU主PMU Panic错误 |
否 |
NPU |
紧急 |
当主PMU异常时,产生此告警,当启动主PMU恢复到正常情况时,此告警消失。 |
|
0x000E0011 |
NPU副PMUA Panic错误 |
否 |
NPU |
紧急 |
当副PMUA异常时,产生此告警,当副PMUA恢复到正常情况时,此告警消失。 |
|
0x000E0012 |
NPU副PMUB Panic错误 |
否 |
NPU |
紧急 |
当副PMUB异常时,产生此告警,当副PMUB恢复到正常情况时,此告警消失。 |
|
0x000E0013 |
NPU传感器错误 |
否 |
NPU |
紧急 |
当NPU继续升温可能触发过温复位,产生此告警,当温度恢复到正常范围内时,此告警恢复。 |
|
0x000E0014 |
NPU硬件异常 |
否 |
NPU |
严重 |
当NPU硬件异常时,产生此告警;当硬件恢复到正常情况时,此告警消失。 |
|
0x000E0015 |
NPU PCIe device启动超时 |
否 |
NPU |
严重 |
NPU PCIe设备启动超时时,产生此告警;当PCIe设备启动正常时,此告警消失。 |
|
0x000E0016 |
NPU PCIe device启动错误 |
否 |
NPU |
严重 |
当NPU PCIe设备启动失败时,产生此告警;当PCIe设备启动正常时,此告警消失 |
|
0x000E0017 |
NPU跨板心跳检测丢失 |
否 |
NPU |
严重 |
当NPU跨板心跳检测丢失时,产生此告警;当跨板心跳检测恢复正常时,此告警消失。 |
|
0x000E0018 |
NPU JPEGD引擎中断注册失败 |
否 |
NPU |
严重 |
当JPEGD引擎中断注册失败时,产生此告警;当JPEGD引擎中断注册成功时,此告警消失。 |
|
0x000E0019 |
NPU JPEGE引擎中断注册失败 |
否 |
NPU |
严重 |
当JPEGE引擎中断注册失败时,产生此告警;当JPEGE引擎中断注册成功时,此告警消失。 |
|
0x000E001A |
NPU VPC引擎中断注册失败 |
否 |
NPU |
严重 |
当VPC引擎中断注册失败时,产生此告警;当VPC引擎中断注册成功时,此告警消失。 |
|
0x000E001B |
NPU PNGD引擎中断注册失败 |
否 |
NPU |
严重 |
当PNGD引擎中断注册失败时,产生此告警;当PNGD引擎中断注册成功时,此告警消失。 |
|
0x000E001C |
NPU VDEC引擎中断注册失败 |
否 |
NPU |
严重 |
当NPU VDEC引擎中断注册失败时,产生此告警;当VDEC引擎中断注册成功时,此告警消失。 |
|
0x000E001D |
NPU VENC引擎中断注册失败 |
否 |
NPU |
严重 |
当NPU VENC引擎中断注册失败时,产生此告警;当VENC引擎中断注册成功时,此告警消失。 |
|
0x000E001E |
NPU JPEGD PROC失败 |
否 |
NPU |
严重 |
当JPEGD处理失败时,产生此告警;当JPEGD处理成功时,此告警消失。 |
|
0x000E001F |
NPU JPEGE PROC失败 |
否 |
NPU |
严重 |
当JPEGE处理失败时,产生此告警;当JPEGE处理成功时,此告警消失。 |
|
0x000E0020 |
NPU VPC PROC失败 |
否 |
NPU |
严重 |
当VPC处理失败时,产生此告警;当VPC处理成功时,此告警消失。 |
|
0x000E0021 |
NPU PNGD PROC失败 |
否 |
NPU |
严重 |
当PNGD处理失败时,产生此告警;当PNGD处理成功时,此告警消失 |
|
0x000E0022 |
NPU VDEC PROC失败 |
否 |
NPU |
严重 |
当VDEC处理失败时,产生此告警;当VDEC处理成功时,此告警消失。 |
|
0x000E0023 |
NPU VENC PROC失败 |
否 |
NPU |
严重 |
当VENC处理失败时,产生此告警;当VENC处理成功时,此告警消失。 |
|
0x000E0024 |
NPU CMD_LIST PROC失败 |
否 |
NPU |
严重 |
CMD_LIST处理失败时,产生此告警;当CMD_LIST处理成功时,此告警消失。 |
|
0x000E0025 |
NPU PCIe DMA初始化异常 |
否 |
NPU |
严重 |
当PCIe DMA初始化异常时,产生此告警;当PCIe DMA初始化恢复正常时,此告警消失。 |
|
0x000E0026 |
NPU PCIe SDIO初始化异常 |
否 |
NPU |
严重 |
当PCIe SDIO初始化异常时,产生此告警;当PCIe SDIO初始化正常时,此告警消失。 |
|
0x000E0027 |
NPU PCIe PM初始化异常 |
否 |
NPU |
严重 |
当PCIe PM初始化异常时,产生此告警;当PCIe PM初始化正常时,此告警消失。 |
|
0x000E0028 |
NPU HIGMAC发送异常 |
否 |
NPU |
严重 |
当HIGMAC发送报文异常时,产生此告警;当HIGMAC发送报文正常时,此告警消失。 |
|
0x000E0029 |
NPU HIGMAC接收数据buff异常 |
否 |
NPU |
严重 |
当HIGMAC接收数据buff异常时,产生此告警;当HIGMAC接收数据buff正常时,此告警消失。 |
|
0x000E002A |
NPU HIGMAC发送数据buff异常 |
否 |
NPU |
严重 |
当HIGMAC发送数据buff异常时,产生此告警;当HIGMAC发送数据buff正常时,此告警消失。 |
|
0x000E002B |
NPU HIGMAC发送BD错误 |
否 |
NPU |
严重 |
当HIGMAC发送BD错误时,产生此告警;当HIGMAC发送BD正常时,此告警消失。 |
|
0x000E002C |
NPU USB状态错误 |
否 |
NPU |
一般 |
当USB状态错误时,产生此告警;当USB状态恢复正常时,此告警消失。 |
|
0x000E002D |
NPU PCIe链路状态存在AER错误 |
否 |
NPU |
一般 |
当PCIe链路状态存在AER错误时,产生此告警;当PCIe链路状态恢复正常时,此告警消失。 |
|
0x000E002E |
NPU BIOS启动失败 |
否 |
NPU |
紧急 |
当BIOS启动异常时,产生此告警;当BIOS启动恢复正常时,此告警消失。 |
|
Wireless_Module告警 |
0x00150000 |
Wireless_Module网络不可用 |
否 |
Wireless_Module |
严重 |
当4G/5G网络状态异常时,产生此告警;当4G/5G网络正常时,此告警消失。 |
0x00150001 |
Wireless_Module开关打开失败 |
否 |
Wireless_Module |
严重 |
如果系统重启前,Wireless_Module开关配置为开启,系统启动过程中打开LTE开关失败,产生此告警;系统启动过程中打开Wireless_Module开关成功或者手动打开LTE开关成功时,此告警消失。 |
|
其他告警 |
x000D0000 |
USB Hub异常 |
是 |
USB集线器 |
一般 |
当USB集线器被损坏时,产生此告警;当USB集线器恢复正常时,此告警消失。 |
0x00180000 |
证书告警 |
是 |
CERT |
严重 |
证书即将过期时产生此告警;当更新为有效证书后,此告警消失。 |
|
0x00131011 |
MEFEdge日志空间满 |
是 |
MEFEdge |
一般 |
当MEFEdge日志和日志转储文件目录已占用空间达到80%以上产生此告警;当已占用空间低于此阈值时,告警消除。 |