OM SDK预留的告警配置
下表中的告警信息包括OM SDK已经实现的告警和暂未实现的预留告警,开发者可以自行实现预留的告警。
告警类型 |
告警ID |
告警名称 |
是否实现 |
告警对象 |
告警等级 |
告警描述 |
---|---|---|---|---|---|---|
温度告警 |
0x00000000 |
硬盘温度过高 |
是 |
硬盘 |
一般 |
当硬盘温度高于一般告警阈值时,产生此告警;当温度恢复到正常范围内时,此告警消失。 |
0x000E003B |
NPU温度检测异常 |
是 |
NPU |
严重 |
当NPU温度高于告警阈值时,产生此告警,当温度恢复到正常范围内时,此告警恢复。 |
|
电源告警 |
0x00110000 |
RTC时钟电池电压过低 |
否 |
RTC时钟 |
一般 |
当RTC时钟电池电压低于1.66V时,产生此告警;当RTC电池电压恢复到3.0V时,此告警消失 |
存储告警 |
0x00000001 |
硬盘寿命到期预警 |
是 |
硬盘 |
一般 |
当硬盘寿命即将到期时,产生此告警;当更换硬盘后,此告警消失。 |
0x00000002 |
硬盘不在位 |
是 |
硬盘 |
一般 |
当检测不到硬盘在位信号时,产生此告警;当检测到硬盘在位时,此告警消失。 |
|
0x00000003 |
硬盘访问阻塞 |
是 |
硬盘 |
紧急 |
当访问硬盘无响应时,产生此告警;当更换硬盘后,此告警消失。 |
|
0x00000004 |
不稳定扇区数临界预警 |
否 |
硬盘 |
严重 |
当硬盘扇区读取出现错误时,不稳定扇区计数会增加,增加到超过临界状态时产生告警;当更换硬盘后,此告警消失。 |
|
0x00000005 |
剩余备用扇区不足 |
否 |
硬盘 |
严重 |
当剩余备用扇区数量接近或已达到临界值时,将产生该告警;当更换硬盘后,此告警消失。 |
|
0x00030000 |
eMMC寿命到期预警 |
是 |
eMMC |
紧急 |
eMMC寿命即将到期。 |
|
0x00030001 |
eMMC平均写入量超标 |
否 |
eMMC |
严重 |
当eMMC连续三天的平均写入量超标时(52GB),会产生此告警;当平均写入量不超过告警门限时,此告警消失。 |
|
0x00030002 |
eMMC每日写入量超标 |
否 |
eMMC |
一般 |
当eMMC每日写入量超标时(52GB),会产生此告警;当每日写入量不超过告警门限时,此告警消失。 |
|
0x00030003 |
eMMC可用预留块不足 |
否 |
eMMC |
紧急 |
当eMMC可用预留块不足时,会产生此告警;当可用预留块充足时,此告警消失。 |
|
0x00040000 |
SD卡挂载失败 |
否 |
SD |
一般 |
当SD卡挂载失败时,产生此告警;当SD卡挂载成功时,此告警消失。 |
|
0x00040001 |
SD卡寿命到期预警 |
否 |
SD |
严重 |
当SD寿命即将到期时,产生此告警;当更换SD卡后,此告警消失。 |
|
0x00120000 |
存储设备挂载配置异常 |
是 |
eMMC/SD/USB/HDD |
严重 |
当MNT设备的挂载配置文件错误时,产生此告警;当MNT设备挂载配置文件恢复正常时,此告警消失。 |
|
0x00120001 |
存储设备分区丢失 |
是 |
eMMC/SD/USB/HDD |
严重 |
当MNT外接存储设备的分区丢失时,产生此告警;当外接存储设备的分区恢复到正常情况时,此告警消失。 |
|
0x00120002 |
存储设备丢失 |
是 |
eMMC/SD/USB/HDD |
严重 |
当MNT外接存储设备丢失时,产生此告警;当外接存储设备恢复到正常情况时,此告警消失。 |
|
0x00120003 |
存储设备挂载失败 |
是 |
eMMC/SD/USB/HDD |
严重 |
当MNT外接存储设备挂载失败时,产生此告警;当外接存储设备挂载正常时,此告警消失。 |
|
0x00120004 |
存储设备挂载点异常 |
是 |
MNT |
严重 |
当MNT外接设备的挂接点错误时,产生此告警;当外接设备的挂接点正常时,此告警消失。 |
|
0x00160000 |
目录空间满 |
是 |
eMMC/DDR |
一般 |
当该目录占用率超过85%时,会产生此告警;当占用率小于80%时,此告警消失。 |
|
NFS告警 |
0x00140000 |
NFS异常 |
是 |
NFS模块 |
严重 |
当NFS挂载状态异常时,产生此告警;当NFS挂载状态正常时,此告警消失。 |
端口告警 |
0x00090000 |
网口接收错包 |
否 |
网口 |
一般 |
当网口收到CRC错包时,产生此告警;当网口24小时未收到CRC错包时,此告警消失。 |
0x00090001 |
网口发送错包 |
否 |
网口 |
一般 |
当网口发送CRC错包时,产生此告警;当网口24小时未检测到发送CRC错包时,此告警消失。 |
|
0x00090002 |
网口链路断开 |
否 |
网口 |
一般 |
当网口link状态由up变成down时,产生此告警;当网口link状态显示up时,此告警消失。 |
|
0x00090003 |
网口设备故障 |
否 |
网口 |
一般 |
当网口无法正常访问时,产生此告警;当网口可正常访问时,此告警消失。 |
|
NPU告警 |
0x000E0000 |
TEEDrv硬件模块错误 |
是 |
NPU |
严重 |
当TEEDrv硬件模块错误时,产生此告警;当TEEDrv硬件模块恢复正常时,此告警消失。 |
0x000E0001 |
TEEDrv侧硬件多bit ECC错误 |
是 |
NPU |
严重 |
当TEEDrv侧硬件多bit ECC错误时,产生此告警;当TEEDrv侧硬件恢复正常时,此告警消失。 |
|
0x000E0002 |
TS心跳检测异常 |
是 |
NPU |
严重 |
当TS心跳检测异常时,产生此告警;当TS心跳恢复正常时,此告警消失。 |
|
0x000E0003 |
TS多bit ECC错误 |
是 |
NPU |
严重 |
当TS多bit ECC错误时,产生此告警;当TS多bit ECC恢复正常时,此告警消失。 |
|
0x000E0004 |
slogd心跳检测异常 |
是 |
NPU |
一般 |
当slogd心跳检测异常时,产生此告警;当slogd心跳恢复正常时,此告警消失。 |
|
0x000E0005 |
dmp_daemon心跳检测异常 |
是 |
NPU |
一般 |
当dmp_daemon心跳检测异常时,产生此告警;当dmp_daemon心跳恢复正常时,此告警消失。 |
|
0x000E0006 |
log-daemon心跳检测异常 |
是 |
NPU |
一般 |
当log-daemon心跳检测异常时,产生此告警;当log-daemon心跳恢复正常时,此告警消失。 |
|
0x000E0007 |
sklogd心跳检测异常 |
是 |
NPU |
一般 |
当sklogd心跳检测异常时,产生此告警;当sklogd心跳恢复正常时,此告警消失。 |
|
0x000E0008 |
Iammgr心跳检测异常 |
是 |
NPU |
一般 |
当Iammgr心跳检测异常时,产生此告警;当Iammgr心跳恢复正常时,此告警消失。 |
|
0x000E0009 |
ProcLauncher心跳检测异常 |
是 |
NPU |
一般 |
当ProcLauncher心跳检测异常时,产生此告警;当ProcLauncher心跳恢复正常时,此告警消失。 |
|
0x000E000A |
ProcMgr心跳检测异常 |
是 |
NPU |
严重 |
当ProcMgr心跳检测异常时,产生此告警;当ProcMgr心跳恢复正常时,此告警消失。 |
|
0x000E000B |
非致命高温异常告警 |
是 |
NPU |
严重 |
当产生非致命高温异常告警时,产生此告警;当温度恢复正常时,此告警消失。 |
|
0x000E000C |
LPM子系统心跳检测异常 |
是 |
NPU |
严重 |
当LPM子系统心跳检测异常时,产生此告警;当LPM子系统心跳恢复正常时,此告警消失。 |
|
0x000E000D |
LPM检测到调压功能异常 |
是 |
NPU |
严重 |
当LPM检测到调压功能异常时,产生此告警;当LPM检测到调压功能恢复正常时,此告警消失。 |
|
0x000E000E |
LPM检测到调频功能异常 |
是 |
NPU |
严重 |
当LPM检测到调频功能异常时,产生此告警;当LPM检测到调频功能恢复正常时,此告警消失。 |
|
0x000E000F |
LPM检测到芯片电流检测功能异常 |
是 |
NPU |
严重 |
当LPM检测到芯片电流检测功能异常时,产生此告警;当LPM检测到芯片电流检测功能恢复正常时,此告警消失。 |
|
0x000E0010 |
LPM检测到Tsensor模块异常 |
是 |
NPU |
严重 |
当LPM检测到Tsensor模块异常时,产生此告警;当LPM检测到Tsensor模块恢复正常时,此告警消失。 |
|
0x000E0011 |
LPM检测到检测到pmbus模块异常 |
是 |
NPU |
严重 |
当LPM检测到Tsensor模块异常时,产生此告警;当LPM检测到pmbus模块恢复正常时,此告警消失。 |
|
0x000E0012 |
AIC多bit ECC错误 |
是 |
NPU |
一般 |
当产生AIC多bit ECC错误时,产生此告警;当AIC多bit ECC错误恢复正常时,此告警消失 |
|
0x000E0013 |
AIC检测到外部输入错误 |
是 |
NPU |
一般 |
当AIC检测到外部输入错误时,产生此告警;当AIC检测到外部输入正常时,此告警消失。 |
|
0x000E0014 |
AIC总线访问错误 |
是 |
NPU |
一般 |
当AIC总线存在访问错误时,产生此告警;当AIC总线访问恢复正常时,此告警消失。 |
|
0x000E0015 |
AIC Dispatch多bit ECC错误 |
是 |
NPU |
严重 |
当AIC Dispatch存在多bit ECC错误时,产生此告警;当AIC Dispatch恢复正常时,此告警消失。 |
|
0x000E0016 |
AIC Dispatch输入错误 |
是 |
NPU |
严重 |
当AIC Dispatch输入错误时,产生此告警;当AIC Dispatch输入恢复正常时,此告警消失。 |
|
0x000E0017 |
AO Dispatch多bit ECC错误 |
是 |
NPU |
严重 |
当AO Dispatch存在多bit ECC错误时,产生此告警;当AO Dispatch多bit ECC错误恢复正常时,此告警消失。 |
|
0x000E0018 |
AO Dispatch输入错误 |
是 |
NPU |
严重 |
当AO Dispatch存在输入错误时,产生此告警;当AO Dispatch输入恢复正常时,此告警消失。 |
|
0x000E0019 |
TaishanCore多bit ECC错误 |
是 |
NPU |
一般 |
当TaishanCore存在多bit ECC错误时,产生此告警;当TaishanCore恢复正常时,此告警消失。 |
|
0x000E001A |
DDR内存颗粒多bit ECC错误 |
是 |
NPU |
紧急 |
当DDR内存颗粒存在多bit ECC错误时,产生此告警;当DDR内存颗粒多bit ECC错误恢复正常时,此告警消失。 |
|
0x000E001B |
DDRA多bit ECC错误 |
是 |
NPU |
紧急 |
当DDRA存在多bit ECC错误时,产生此告警;当DDRA多bit ECC错误恢复正常时,此告警消失。 |
|
0x000E001C |
来自DDRC的错误响应 |
是 |
NPU |
紧急 |
当存在来自DDRC的错误响应时,产生此告警;当来自DDRC的错误响应恢复正常时,此告警消失。 |
|
0x000E001D |
DDRC硬件模块内部逻辑异常 |
是 |
NPU |
紧急 |
DDRC硬件模块内部逻辑异常时,产生此告警;DDRC硬件模块内部逻辑异常正常时,此告警消失。 |
|
0x000E001E |
DDRC总线访问错误 |
是 |
NPU |
紧急 |
当DDRC总线访问错误时,产生此告警;当DDRC总线访问正常时,此告警消失。 |
|
0x000E001F |
DDRC多bit ECC错误 |
是 |
NPU |
紧急 |
当DDRC多bit ECC错误时,产生此告警;当DDRC恢复正常时,此告警消失。 |
|
0x000E0020 |
DDR颗粒高温异常:非致命高温异常告警 |
是 |
NPU |
严重 |
当DDR颗粒高温异常时,产生此告警;当DDR颗粒温度恢复正常时,此告警消失。 |
|
0x000E0021 |
DVPP Dispatch多bit ECC错误 |
是 |
NPU |
严重 |
当DVPP Dispatch多bit ECC错误时,产生此告警;当DVPP Dispatch多bit ECC正常时,此告警消失。 |
|
0x000E0022 |
DVPP Dispatch输入错误 |
是 |
NPU |
严重 |
当DVPP Dispatch输入错误时,产生此告警;当DVPP Dispatch输入正常时,此告警消失。 |
|
0x000E0023 |
HSM密钥管理模块错误 |
是 |
NPU |
严重 |
当HSM密钥管理模块错误时,产生此告警;当HSM密钥管理模块正常时,此告警消失。 |
|
0x000E0024 |
HSM密码算法模块错误 |
是 |
NPU |
严重 |
当HSM密码算法模块错误时,产生此告警;当HSM密码算法模块正常时,此告警消失。 |
|
0x000E0025 |
HWTS总线访问错误 |
是 |
NPU |
严重 |
当HWTS总线访问错误时,产生此告警;当HWTS总线访问正常时,此告警消失。 |
|
0x000E0026 |
HWTS多bit ECC错误 |
是 |
NPU |
严重 |
当HWTS多bit ECC错误时,产生此告警;当HWTS多bit ECC正常时,此告警消失。 |
|
0x000E0027 |
JPEGD总线访问错误 |
是 |
NPU |
一般 |
当JPEGD总线访问错误时,产生此告警,当JPEGD总线访问恢复正常时,此告警消失。 |
|
0x000E0028 |
JPEGE硬件编码异常 |
是 |
NPU |
一般 |
当JPEGE硬件编码异常时,产生此告警,当JPEGE硬件编码恢复正常时,此告警消失。 |
|
0x000E0029 |
JPEGE总线访问错误 |
是 |
NPU |
一般 |
当JPEGE总线访问错误时,产生此告警,当JPEGE总线访问恢复正常时,此告警消失。 |
|
0x000E002A |
L2BUFF多bit ECC错误 |
是 |
NPU |
严重 |
当L2BUFF发生多bit ECC错误时,产生此告警,当L2BUFF恢复正常时,此告警消失。 |
|
0x000E002B |
L2BUFF内部软件配置错误 |
是 |
NPU |
一般 |
当L2BUFF内部软件配置错误时,产生此告警,当L2BUFF内部软件配置恢复正常时,此告警消失。 |
|
0x000E002C |
L3D多bit ECC错误 |
是 |
NPU |
严重 |
当L3D发生多bit ECC错误时,产生此告警,当L3D恢复正常时,此告警消失。 |
|
0x000E002D |
L3T多bit ECC错误 |
是 |
NPU |
严重 |
当L3T发生多bit ECC错误时,产生此告警,当L3T恢复正常时,此告警消失。 |
|
0x000E002E |
NIC多bit ECC错误 |
是 |
NPU |
严重 |
当NIC发生多bit ECC错误时,产生此告警,当NIC模块恢复正常时,此告警消失。 |
|
0x000E002F |
NIC模块异常 |
是 |
NPU |
严重 |
当NIC模块异常时,产生此告警,当NIC模块恢复正常时,此告警消失。 |
|
0x000E0030 |
PERI Dispatch多bit ECC错误 |
是 |
NPU |
严重 |
当PERI Dispatch多bit ECC错误时,产生此告警,当PERI Dispatch恢复正常时,此告警消失。 |
|
0x000E0031 |
PERI Dispatch输入错误 |
是 |
NPU |
严重 |
当PERI Dispatch输入错误时,产生此告警,当PERI Dispatch输入恢复正常时,此告警消失。 |
|
0x000E0032 |
SDMA多bit ECC错误 |
是 |
NPU |
一般 |
当SDMA发生多bit ECC时,产生此告警;当SDMA恢复正常时,此告警消失。 |
|
0x000E0033 |
SDMA模块bus error |
是 |
NPU |
一般 |
当SDMA模块发生bus error时,产生此告警;当SDMA模块恢复正常时,此告警消失。 |
|
0x000E0034 |
VDEC多bit ECC错误 |
是 |
NPU |
一般 |
当VDEC发生多bit ECC错误时,产生此告警;当VDEC恢复正常时,此告警消失。 |
|
0x000E0035 |
VENC硬件编码超时 |
是 |
NPU |
一般 |
当VENC硬件编码超时时,产生此告警;当VENC硬件编码恢复正常时,此告警消失。 |
|
0x000E0036 |
VENC硬件编码异常 |
是 |
NPU |
一般 |
当VENC硬件编码异常时,产生此告警;当VVENC硬件编码恢复正常时,此告警消失。 |
|
0x000E0037 |
VPC图像处理硬件异常 |
是 |
NPU |
一般 |
当VPC图像处理硬件异常时,产生此告警;当VPC图像处理硬件恢复正常时,此告警消失。 |
|
0x000E0038 |
VPC图像处理配置异常 |
是 |
NPU |
一般 |
当VPC图像处理配置异常时,产生此告警;当VPC图像处理配置恢复正常时,此告警消失。 |
|
0x000E0039 |
VPC多bit ECC错误 |
是 |
NPU |
一般 |
当VPC发生多bit ECC错误时,产生此告警;当VPC恢复正常时,此告警消失。 |
|
Wireless_Module告警 |
0x00150000 |
Wireless_Module网络不可用 |
否 |
Wireless_Module |
严重 |
当4G/5G网络状态异常时,产生此告警;当4G/5G网络正常时,此告警消失。 |
0x00150001 |
Wireless_Module开关打开失败 |
否 |
Wireless_Module |
严重 |
如果系统重启前,Wireless_Module开关配置为开启,系统启动过程中打开LTE开关失败,产生此告警;系统启动过程中打开Wireless_Module开关成功或者手动打开LTE开关成功时,此告警消失。 |
|
其他告警 |
0x000D0000 |
USB Hub异常 |
是 |
USB集线器 |
一般 |
当USB集线器被损坏时,产生此告警;当USB集线器恢复正常时,此告警消失。 |
0x00180000 |
证书告警 |
是 |
CERT,FD_CERT |
严重 |
证书即将过期时产生此告警;当更新为有效证书后,此告警消失。 |