查询指定芯片健康状态
命令功能
npu-smi info -t health -i id -c chip_id 用于查询某个芯片的健康状态。
命令格式
npu-smi info -t health -i id -c chip_id
参数说明
类型 |
描述 |
---|---|
id |
设备id。通过npu-smi info -l命令查出的NPU ID即为设备id。 |
chip_id |
芯片id。通过npu-smi info -m命令查出的Chip ID即为芯片id。 |
使用指南
Linux物理机 |
Linux物理机容器 |
Linux虚拟机 |
|
---|---|---|---|
root用户 |
运行用户组(非root用户) |
root用户 |
root用户 |
Y |
Y |
Y |
NA |
Linux物理机 |
Linux物理机容器 |
Linux虚拟机 |
|
---|---|---|---|
root用户 |
运行用户组(非root用户) |
root用户 |
root用户 |
Y |
Y |
Y |
Y |
使用实例
查询设备0中编号为0的芯片的健康状态。
npu-smi info -t health -i 0 -c 0
Health Status : OK Error Code : NA Error Information : NA
输出说明
字段 |
说明 |
---|---|
Health Status |
芯片的健康状态 有如下五种状态:OK、Warning、Alarm、Critical或UNKNOWN
|
Error Code |
错误码 若打印信息中提示有错误码,请参考对应产品的《黑匣子错误码信息列表》进行查看。 |
Error Information |
错误信息 |
父主题: 信息查询(info)