健康检查

接口功能

检查服务状态是否正常。服务正常时,返回状态码200,消息体没有内容。

该接口建议每隔五秒发送一次。

接口格式

操作类型:GET

URL:https://{ip}:{port}/v2/health/live

URL:https://{ip}:{port}/v2/health/ready

URL:https://{ip}:{port}/v2/models/${MODEL_NAME}[/versions/${MODEL_VERSION}]/ready

  • {ip}字段优先读取环境变量值MIES_CONTAINER_MANAGEMENT_IP;如果没有该环境变量,则取配置文件的“managementIpAddress”参数;如果配置文件中没有“managementIpAddress”参数,则取配置文件的“ipAddress”参数。
  • {port}字段优先读取配置文件的“managementPort”参数;如果配置文件中没有“managementPort”参数,则取配置文件的“port”参数。
  • ${MODEL_NAME}字段指定需要查询的模型名称。
  • [/versions/${MODEL_VERSION}]字段暂不支持,不传递。

请求参数

使用样例

请求样例1:

GET https://{ip}:{port}/v2/health/live
GET https://{ip}:{port}/v2/models/llama_65b/ready

响应样例1:

请求样例2:

GET https://{ip}:{port}/v2/health/ready

响应样例2:

输出说明