接口格式
操作类型:GET
URL:https://{ip}:{port}/v2/models/{MODEL_NAME}/versions/${MODEL_VERSION}/ready
- {ip}优先取启动命令参数中的{manage_ip};如果没有配置该命令行参数,则取配置文件ms_coordinator.json的“manage_ip”参数。
- {port}优先取启动命令参数中的{manage_port};如果没有配置该命令行参数,则取配置文件ms_coordinator.json的“manage_port”参数。
- ${MODEL_NAME}字段指定需要查询的模型名称。
- /versions/${MODEL_VERSION}字段暂不支持,不传递。
使用样例
请求样例:
GET https://{ip}:{port}/v2/models/llama3-70b/ready
响应样例:
Triton模型已就绪时无内容。
输出说明
- 状态码200,表示Triton模型已就绪,消息体没有内容。
- 状态码503,表示Triton模型未就绪,消息体没有内容。