文档
注册
评分
提单
论坛
小AI

OM SDK预留的告警配置

下表中的告警信息包括OM SDK已经实现的告警和暂未实现的预留告警,开发者可以自行实现预留的告警。

表1 OM SDK预留的告警信息

告警类型

告警ID

告警名称

是否实现

告警对象

告警等级

告警描述

温度告警

0x00000000

硬盘温度过高

硬盘

一般

当硬盘温度高于一般告警阈值时,产生此告警;当温度恢复到正常范围内时,此告警消失。

0x000E003B

NPU温度检测异常

NPU

严重

当NPU温度高于告警阈值时,产生此告警,当温度恢复到正常范围内时,此告警恢复。

电源告警

0x00110000

RTC时钟电池电压过低

RTC时钟

一般

当RTC时钟电池电压低于1.66V时,产生此告警;当RTC电池电压恢复到3.0V时,此告警消失

存储告警

0x00000001

硬盘寿命到期预警

硬盘

一般

当硬盘寿命即将到期时,产生此告警;当更换硬盘后,此告警消失。

0x00000002

硬盘不在位

硬盘

一般

当检测不到硬盘在位信号时,产生此告警;当检测到硬盘在位时,此告警消失。

0x00000003

硬盘访问阻塞

硬盘

紧急

当访问硬盘无响应时,产生此告警;当更换硬盘后,此告警消失。

0x00000004

不稳定扇区数临界预警

硬盘

严重

当硬盘扇区读取出现错误时,不稳定扇区计数会增加,增加到超过临界状态时产生告警;当更换硬盘后,此告警消失。

0x00000005

剩余备用扇区不足

硬盘

严重

当剩余备用扇区数量接近或已达到临界值时,将产生该告警;当更换硬盘后,此告警消失。

0x00030000

eMMC寿命到期预警

eMMC

紧急

eMMC寿命即将到期。

0x00030001

eMMC平均写入量超标

eMMC

严重

当eMMC连续三天的平均写入量超标时(52GB),会产生此告警;当平均写入量不超过告警门限时,此告警消失。

0x00030002

eMMC每日写入量超标

eMMC

一般

当eMMC每日写入量超标时(52GB),会产生此告警;当每日写入量不超过告警门限时,此告警消失。

0x00030003

eMMC可用预留块不足

eMMC

紧急

当eMMC可用预留块不足时,会产生此告警;当可用预留块充足时,此告警消失。

0x00040000

SD卡挂载失败

SD

一般

当SD卡挂载失败时,产生此告警;当SD卡挂载成功时,此告警消失。

0x00040001

SD卡寿命到期预警

SD

严重

当SD寿命即将到期时,产生此告警;当更换SD卡后,此告警消失。

0x00120000

存储设备挂载配置异常

eMMC/SD/USB/HDD

严重

当MNT设备的挂载配置文件错误时,产生此告警;当MNT设备挂载配置文件恢复正常时,此告警消失。

0x00120001

存储设备分区丢失

eMMC/SD/USB/HDD

严重

当MNT外接存储设备的分区丢失时,产生此告警;当外接存储设备的分区恢复到正常情况时,此告警消失。

0x00120002

存储设备丢失

eMMC/SD/USB/HDD

严重

当MNT外接存储设备丢失时,产生此告警;当外接存储设备恢复到正常情况时,此告警消失。

0x00120003

存储设备挂载失败

eMMC/SD/USB/HDD

严重

当MNT外接存储设备挂载失败时,产生此告警;当外接存储设备挂载正常时,此告警消失。

0x00120004

存储设备挂载点异常

MNT

严重

当MNT外接设备的挂接点错误时,产生此告警;当外接设备的挂接点正常时,此告警消失。

0x00160000

目录空间满

eMMC/DDR

一般

当该目录占用率超过85%时,会产生此告警;当占用率小于80%时,此告警消失。

NFS告警

0x00140000

NFS异常

NFS模块

严重

当NFS挂载状态异常时,产生此告警;当NFS挂载状态正常时,此告警消失。

端口告警

0x00090000

网口接收错包

网口

一般

当网口收到CRC错包时,产生此告警;当网口24小时未收到CRC错包时,此告警消失。

0x00090001

网口发送错包

网口

一般

当网口发送CRC错包时,产生此告警;当网口24小时未检测到发送CRC错包时,此告警消失。

0x00090002

网口链路断开

网口

一般

当网口link状态由up变成down时,产生此告警;当网口link状态显示up时,此告警消失。

0x00090003

网口设备故障

网口

一般

当网口无法正常访问时,产生此告警;当网口可正常访问时,此告警消失。

NPU告警

0x000E0000

TEEDrv硬件模块错误

NPU

严重

当TEEDrv硬件模块错误时,产生此告警;当TEEDrv硬件模块恢复正常时,此告警消失。

0x000E0001

TEEDrv侧硬件多bit ECC错误

NPU

严重

当TEEDrv侧硬件多bit ECC错误时,产生此告警;当TEEDrv侧硬件恢复正常时,此告警消失。

0x000E0002

TS心跳检测异常

NPU

严重

当TS心跳检测异常时,产生此告警;当TS心跳恢复正常时,此告警消失。

0x000E0003

TS多bit ECC错误

NPU

严重

当TS多bit ECC错误时,产生此告警;当TS多bit ECC恢复正常时,此告警消失。

0x000E0004

slogd心跳检测异常

NPU

一般

当slogd心跳检测异常时,产生此告警;当slogd心跳恢复正常时,此告警消失。

0x000E0005

dmp_daemon心跳检测异常

NPU

一般

当dmp_daemon心跳检测异常时,产生此告警;当dmp_daemon心跳恢复正常时,此告警消失。

0x000E0006

log-daemon心跳检测异常

NPU

一般

当log-daemon心跳检测异常时,产生此告警;当log-daemon心跳恢复正常时,此告警消失。

0x000E0007

sklogd心跳检测异常

NPU

一般

当sklogd心跳检测异常时,产生此告警;当sklogd心跳恢复正常时,此告警消失。

0x000E0008

Iammgr心跳检测异常

NPU

一般

当Iammgr心跳检测异常时,产生此告警;当Iammgr心跳恢复正常时,此告警消失。

0x000E0009

ProcLauncher心跳检测异常

NPU

一般

当ProcLauncher心跳检测异常时,产生此告警;当ProcLauncher心跳恢复正常时,此告警消失。

0x000E000A

ProcMgr心跳检测异常

NPU

严重

当ProcMgr心跳检测异常时,产生此告警;当ProcMgr心跳恢复正常时,此告警消失。

0x000E000B

非致命高温异常告警

NPU

严重

当产生非致命高温异常告警时,产生此告警;当温度恢复正常时,此告警消失。

0x000E000C

LPM子系统心跳检测异常

NPU

严重

当LPM子系统心跳检测异常时,产生此告警;当LPM子系统心跳恢复正常时,此告警消失。

0x000E000D

LPM检测到调压功能异常

NPU

严重

当LPM检测到调压功能异常时,产生此告警;当LPM检测到调压功能恢复正常时,此告警消失。

0x000E000E

LPM检测到调频功能异常

NPU

严重

当LPM检测到调频功能异常时,产生此告警;当LPM检测到调频功能恢复正常时,此告警消失。

0x000E000F

LPM检测到芯片电流检测功能异常

NPU

严重

当LPM检测到芯片电流检测功能异常时,产生此告警;当LPM检测到芯片电流检测功能恢复正常时,此告警消失。

0x000E0010

LPM检测到Tsensor模块异常

NPU

严重

当LPM检测到Tsensor模块异常时,产生此告警;当LPM检测到Tsensor模块恢复正常时,此告警消失。

0x000E0011

LPM检测到检测到pmbus模块异常

NPU

严重

当LPM检测到Tsensor模块异常时,产生此告警;当LPM检测到pmbus模块恢复正常时,此告警消失。

0x000E0012

AIC多bit ECC错误

NPU

一般

当产生AIC多bit ECC错误时,产生此告警;当AIC多bit ECC错误恢复正常时,此告警消失

0x000E0013

AIC检测到外部输入错误

NPU

一般

当AIC检测到外部输入错误时,产生此告警;当AIC检测到外部输入正常时,此告警消失。

0x000E0014

AIC总线访问错误

NPU

一般

当AIC总线存在访问错误时,产生此告警;当AIC总线访问恢复正常时,此告警消失。

0x000E0015

AIC Dispatch多bit ECC错误

NPU

严重

当AIC Dispatch存在多bit ECC错误时,产生此告警;当AIC Dispatch恢复正常时,此告警消失。

0x000E0016

AIC Dispatch输入错误

NPU

严重

当AIC Dispatch输入错误时,产生此告警;当AIC Dispatch输入恢复正常时,此告警消失。

0x000E0017

AO Dispatch多bit ECC错误

NPU

严重

当AO Dispatch存在多bit ECC错误时,产生此告警;当AO Dispatch多bit ECC错误恢复正常时,此告警消失。

0x000E0018

AO Dispatch输入错误

NPU

严重

当AO Dispatch存在输入错误时,产生此告警;当AO Dispatch输入恢复正常时,此告警消失。

0x000E0019

TaishanCore多bit ECC错误

NPU

一般

当TaishanCore存在多bit ECC错误时,产生此告警;当TaishanCore恢复正常时,此告警消失。

0x000E001A

DDR内存颗粒多bit ECC错误

NPU

紧急

当DDR内存颗粒存在多bit ECC错误时,产生此告警;当DDR内存颗粒多bit ECC错误恢复正常时,此告警消失。

0x000E001B

DDRA多bit ECC错误

NPU

紧急

当DDRA存在多bit ECC错误时,产生此告警;当DDRA多bit ECC错误恢复正常时,此告警消失。

0x000E001C

来自DDRC的错误响应

NPU

紧急

当存在来自DDRC的错误响应时,产生此告警;当来自DDRC的错误响应恢复正常时,此告警消失。

0x000E001D

DDRC硬件模块内部逻辑异常

NPU

紧急

DDRC硬件模块内部逻辑异常时,产生此告警;DDRC硬件模块内部逻辑异常正常时,此告警消失。

0x000E001E

DDRC总线访问错误

NPU

紧急

当DDRC总线访问错误时,产生此告警;当DDRC总线访问正常时,此告警消失。

0x000E001F

DDRC多bit ECC错误

NPU

紧急

当DDRC多bit ECC错误时,产生此告警;当DDRC恢复正常时,此告警消失。

0x000E0020

DDR颗粒高温异常:非致命高温异常告警

NPU

严重

当DDR颗粒高温异常时,产生此告警;当DDR颗粒温度恢复正常时,此告警消失。

0x000E0021

DVPP Dispatch多bit ECC错误

NPU

严重

当DVPP Dispatch多bit ECC错误时,产生此告警;当DVPP Dispatch多bit ECC正常时,此告警消失。

0x000E0022

DVPP Dispatch输入错误

NPU

严重

当DVPP Dispatch输入错误时,产生此告警;当DVPP Dispatch输入正常时,此告警消失。

0x000E0023

HSM密钥管理模块错误

NPU

严重

当HSM密钥管理模块错误时,产生此告警;当HSM密钥管理模块正常时,此告警消失。

0x000E0024

HSM密码算法模块错误

NPU

严重

当HSM密码算法模块错误时,产生此告警;当HSM密码算法模块正常时,此告警消失。

0x000E0025

HWTS总线访问错误

NPU

严重

当HWTS总线访问错误时,产生此告警;当HWTS总线访问正常时,此告警消失。

0x000E0026

HWTS多bit ECC错误

NPU

严重

当HWTS多bit ECC错误时,产生此告警;当HWTS多bit ECC正常时,此告警消失。

0x000E0027

JPEGD总线访问错误

NPU

一般

当JPEGD总线访问错误时,产生此告警,当JPEGD总线访问恢复正常时,此告警消失。

0x000E0028

JPEGE硬件编码异常

NPU

一般

当JPEGE硬件编码异常时,产生此告警,当JPEGE硬件编码恢复正常时,此告警消失。

0x000E0029

JPEGE总线访问错误

NPU

一般

当JPEGE总线访问错误时,产生此告警,当JPEGE总线访问恢复正常时,此告警消失。

0x000E002A

L2BUFF多bit ECC错误

NPU

严重

当L2BUFF发生多bit ECC错误时,产生此告警,当L2BUFF恢复正常时,此告警消失。

0x000E002B

L2BUFF内部软件配置错误

NPU

一般

当L2BUFF内部软件配置错误时,产生此告警,当L2BUFF内部软件配置恢复正常时,此告警消失。

0x000E002C

L3D多bit ECC错误

NPU

严重

当L3D发生多bit ECC错误时,产生此告警,当L3D恢复正常时,此告警消失。

0x000E002D

L3T多bit ECC错误

NPU

严重

当L3T发生多bit ECC错误时,产生此告警,当L3T恢复正常时,此告警消失。

0x000E002E

NIC多bit ECC错误

NPU

严重

当NIC发生多bit ECC错误时,产生此告警,当NIC模块恢复正常时,此告警消失。

0x000E002F

NIC模块异常

NPU

严重

当NIC模块异常时,产生此告警,当NIC模块恢复正常时,此告警消失。

0x000E0030

PERI Dispatch多bit ECC错误

NPU

严重

当PERI Dispatch多bit ECC错误时,产生此告警,当PERI Dispatch恢复正常时,此告警消失。

0x000E0031

PERI Dispatch输入错误

NPU

严重

当PERI Dispatch输入错误时,产生此告警,当PERI Dispatch输入恢复正常时,此告警消失。

0x000E0032

SDMA多bit ECC错误

NPU

一般

当SDMA发生多bit ECC时,产生此告警;当SDMA恢复正常时,此告警消失。

0x000E0033

SDMA模块bus error

NPU

一般

当SDMA模块发生bus error时,产生此告警;当SDMA模块恢复正常时,此告警消失。

0x000E0034

VDEC多bit ECC错误

NPU

一般

当VDEC发生多bit ECC错误时,产生此告警;当VDEC恢复正常时,此告警消失。

0x000E0035

VENC硬件编码超时

NPU

一般

当VENC硬件编码超时时,产生此告警;当VENC硬件编码恢复正常时,此告警消失。

0x000E0036

VENC硬件编码异常

NPU

一般

当VENC硬件编码异常时,产生此告警;当VVENC硬件编码恢复正常时,此告警消失。

0x000E0037

VPC图像处理硬件异常

NPU

一般

当VPC图像处理硬件异常时,产生此告警;当VPC图像处理硬件恢复正常时,此告警消失。

0x000E0038

VPC图像处理配置异常

NPU

一般

当VPC图像处理配置异常时,产生此告警;当VPC图像处理配置恢复正常时,此告警消失。

0x000E0039

VPC多bit ECC错误

NPU

一般

当VPC发生多bit ECC错误时,产生此告警;当VPC恢复正常时,此告警消失。

Wireless_Module告警

0x00150000

Wireless_Module网络不可用

Wireless_Module

严重

当4G/5G网络状态异常时,产生此告警;当4G/5G网络正常时,此告警消失。

0x00150001

Wireless_Module开关打开失败

Wireless_Module

严重

如果系统重启前,Wireless_Module开关配置为开启,系统启动过程中打开LTE开关失败,产生此告警;系统启动过程中打开Wireless_Module开关成功或者手动打开LTE开关成功时,此告警消失。

其他告警

0x000D0000

USB Hub异常

USB集线器

一般

当USB集线器被损坏时,产生此告警;当USB集线器恢复正常时,此告警消失。

0x00180000

证书告警

CERT,FD_CERT

严重

证书即将过期时产生此告警;当更新为有效证书后,此告警消失。

搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词