采集动态状态。
操作类型:GET
URL:https://{ip}:{port}/v1/status
无
请求样例:
GET https://{ip}:{port}/v1/status
{ "service": { "roleStatus": "RoleUnknown", "currentRole": "prefill" }, "resource": { "availSlotsNum": 200, "availBlockNum": 1024 }, "peers": ["1.2.3.4", "5.6.7.8"] }
参数 |
是否必选 |
类型 |
描述 |
---|---|---|---|
service |
必选 |
结构体 |
service相关属性。 |
resource |
必选 |
结构体 |
当前剩余资源情况。 |
peers |
可选 |
字符串数组 |
数组成员为IP地址,表示已经成功建连的P实例。
|
service.roleStatus |
必选 |
字符串 |
表示当前服务的身份切换状态,可选值包括:
如果是PD混部场景,该状态永远是RoleReady。 |
service.currentRole |
必选 |
字符串 |
当前实例的身份,可选值包括:
如果是PD混部场景,该值永远是none。 在PD分离场景下,如果roleStatus进入RoleReady状态,则该值为prefill或decode,如果roleStatus不是RoleReady状态,该值为none。 |
resource.availSlotsNum |
必选 |
整型 |
可用的slot数量。 |
resource.availBlockNum |
必选 |
整型 |
可用的block数量。 |