健康检查
接口功能
检查服务状态是否正常。服务正常时,返回状态码200,消息体没有内容。
接口格式
操作类型:GET
URL:https://{ip}:{port}/v2/health/live
URL:https://{ip}:{port}/v2/health/ready
URL:https://{ip}:{port}/v2/models/${MODEL_NAME}[/versions/${MODEL_VERSION}]/ready
- {ip}字段优先读取环境变量值MIES_CONTAINER_MANAGEMENT_IP;如果没有该环境变量,则取配置文件的“managementIpAddress”参数;如果配置文件中没有“managementIpAddress”参数,则取配置文件的“ipAddress”参数。
- {port}字段优先读取配置文件的“managementPort”参数;如果配置文件中没有“managementPort”参数,则取配置文件的“port”参数。
- ${MODEL_NAME}字段指定需要查询的模型名称。
- [/versions/${MODEL_VERSION}]字段暂不支持,不传递。
请求参数
无
使用样例
请求样例一:
GET https://{ip}:{port}/v2/health/live GET https://{ip}:{port}/v2/models/llama_65b/ready
响应样例一:
- 从节点异常
{ "message": no contact node detected, "no_contact_node": ["node(10.10.10.10) is no contact"] }
请求样例二:
GET https://{ip}:{port}/v2/health/ready
响应样例二:
输出说明
- 状态码200,服务状态正常,消息体没有内容。
- 其他状态码,服务状态异常。
父主题: 兼容Triton接口