查询服务元数据

接口功能

查询服务元数据信息。

接口格式

操作类型:GET

URL:https://{ip}:{port}/v2

{ip}和{port}请使用业务面的IP地址和端口号,即“ipAddress”“port”

请求参数

使用样例

请求样例:

GET https://{ip}:{port}/v2

响应样例:

{
    "name": "MindIE Server",
    "version": "{version}",
    "extensions": {
        "max_iter_times": 512,  
        "prefill_policy_type": 0,
        "decode_policy_type": 0,
        "max_prefill_batch_size": 50,
        "max_prefill_tokens": 8192
    }
}

响应状态码:200

输出说明

参数

类型

说明

name

string

服务名称,暂定"MindIE Server"。

version

string

服务版本。

extensions

object

扩展字段。

max_iter_times

int

最大可进行的Decode次数。

prefill_policy_type

int

Prefill阶段的调度策略,详情请参见ScheduleConfig参数说明中的prefillPolicyType参数。

decode_policy_type

int

Decode阶段的调度策略,详情请请见ScheduleConfig参数说明中的decodePolicyType参数。

max_prefill_batch_size

int

最大prefill batch size。

max_prefill_tokens

int

最大prefill token数量。