下载
中文
注册

Triton模型就绪状态检查接口

接口功能

检查Triton模型就绪状态。

端口类型

管理端口。

接口格式

操作类型:GET

URL:https://{ip}:{port}/v2/models/{MODEL_NAME}/versions/${MODEL_VERSION}/ready

  • {ip}优先取启动命令参数中的{manage_ip};如果没有配置该命令行参数,则取配置文件ms_coordinator.json的“manage_ip”参数。
  • {port}优先取启动命令参数中的{manage_port};如果没有配置该命令行参数,则取配置文件ms_coordinator.json的“manage_port”参数。
  • ${MODEL_NAME}字段指定需要查询的模型名称。
  • /versions/${MODEL_VERSION}字段暂不支持,不传递。

请求参数

使用样例

请求样例:

GET https://{ip}:{port}/v2/models/llama3-70b/ready

响应样例:

Triton模型已就绪时无内容。

输出说明

  • 状态码200,表示Triton模型已就绪,消息体没有内容。
  • 状态码503,表示Triton模型未就绪,消息体没有内容。