查询服务元数据

接口功能

查询服务元数据信息。

接口格式

操作类型:GET

URL:https://{ip}:{port}/v2

请求参数

使用样例

请求样例:

GET https://<ip>:<port>/v2

响应样例:

{
 "name": "MindIE Server",
 "version": "{version}",
 "extensions": {
  "max_iter_times": 512,  
  "prefill_policy_type": 0,
  "decode_policy_type": 0,
  "max_prefill_batch_size": 50,
  "max_prefill_tokens": 8192
 }
}

响应状态码:200

输出说明

参数

类型

说明

name

string

服务名称,暂定"MindIE Server"。

version

string

服务版本。

extensions

object

扩展字段。

max_iter_times

int

最大可进行的decode次数。

prefill_policy_type

int

prefill阶段的调度策略。

decode_policy_type

int

decode阶段的调度策略。

max_prefill_batch_size

int

最大prefill batch size。

max_prefill_tokens

int

最大prefill token数量。