提前终止请求接口

接口功能

参考Triton接口定义,提供提前终止请求接口。

接口格式

操作类型:POST

URL:https://{ip}:{port}/v2/models/${MODEL_NAME}[/versions/${MODEL_VERSION}]/stopInfer

请求参数

参数

是否必选

说明

取值要求

id

必选

推理请求id。

字符串。

[/versions/${MODEL_VERSION}]字段暂不支持,不传递。

使用样例

请求样例:

POST https://<ip>:<port>/v2/models/llama_65b/stopInfer

请求消息体:

{
  "id":"a123"
}

响应样例:

{
  "id":"a123"
}

响应状态码:200

输出说明

返回值

类型

说明

id

string

成功停止推理请求id。