提前终止请求接口
data:image/s3,"s3://crabby-images/b5162/b516257fb056ebfc6fe508c351c78c93c8bc9492" alt=""
目前该接口只支持提前终止Triton推理请求。
接口功能
参考Triton接口定义,提供提前终止请求接口。
接口格式
操作类型:POST
URL:https://{ip}:{port}/v2/models/${MODEL_NAME}[/versions/${MODEL_VERSION}]/stopInfer
data:image/s3,"s3://crabby-images/b5162/b516257fb056ebfc6fe508c351c78c93c8bc9492" alt=""
- {ip}和{port}请使用业务面的IP地址和端口号,即“ipAddress”和“port”。
- ${MODEL_NAME}字段指定需要查询的模型名称。
- [/versions/${MODEL_VERSION}]字段暂不支持,不传递。
请求参数
参数 |
是否必选 |
说明 |
取值要求 |
---|---|---|---|
id |
必选 |
推理请求ID。 |
长度不超过256的非空字符串。 |
使用样例
请求样例:
POST https://{ip}:{port}/v2/models/llama_65b/stopInfer
请求消息体:
{ "id":"a123" }
响应样例:
{ "id":"a123" }
响应状态码:200
输出说明
返回值 |
类型 |
说明 |
---|---|---|
id |
string |
成功停止推理请求ID。 |
父主题: MindIE原生接口