Triton模型就绪状态检查接口
接口功能
检查Triton模型就绪状态。
端口类型
管理端口。
接口格式
操作类型:GET
URL:https://{ip}:{port}/v2/models/{MODEL_NAME}/versions/${MODEL_VERSION}/ready
请求参数
无
使用样例
请求样例:
GET https://{ip}:{port}/v2/models/llama3-70b/ready
响应样例:
Triton模型已就绪时无内容。
输出说明
- 状态码200,表示Triton模型已就绪,消息体没有内容。
- 状态码503,表示Triton模型未就绪,消息体没有内容。
父主题: 集群内通信接口