下载
中文
注册

查询所有芯片健康状态

命令功能

npu-smi info -t health -i id 用于查询所有芯片的健康状态。

命令格式

npu-smi info -t health -i id

参数说明

类型

描述

id

设备id。通过npu-smi info -l命令查出的NPU ID即为设备id。

使用指南

表1 Atlas 200I DK A2 开发者套件Atlas 500 A2 智能小站Atlas 200I A2 加速模块(RC场景)部署场景

Linux物理机

Linux物理机容器

Linux虚拟机

root用户

运行用户组(非root用户)

root用户

root用户

Y

Y

Y

NA

表2 Atlas 200I A2 加速模块(EP场景)部署场景

Linux物理机

Linux物理机容器

Linux虚拟机

root用户

运行用户组(非root用户)

root用户

root用户

Y

Y

Y

Y

使用实例

查询设备0所有芯片的健康状态。

npu-smi info -t health -i 0
        NPU ID                         : 0
        Chip Count                     : 1
  
        Chip ID                        : 0
        Health                         : OK

        Health                         : OK
        Chip Name                      : MCU

输出说明

表3 打印信息说明

字段

说明

NPU ID

设备id

Chip Count

芯片个数

Chip ID

芯片id

Health

芯片的健康状态

有如下五种状态:OK、Warning、Alarm、Critical或UNKNOWN

  • OK:正常
  • Warning:一般告警
  • Alarm:重要告警
  • Critical:紧急告警
  • UNKNOWN:该设备不存在或未启动

Chip Name

芯片名称

说明:

Atlas 200I DK A2 开发者套件Atlas 200I A2 加速模块不支持该字段。