查询服务元数据信息。
操作类型:GET
URL:https://{ip}:{port}/v2
{ip}和{port}请使用业务面的IP地址和端口号,即“ipAddress”和“port”。
无
请求样例:
GET https://{ip}:{port}/v2
响应样例:
{ "name": "MindIE Server", "version": "{version}", "extensions": { "max_iter_times": 512, "prefill_policy_type": 0, "decode_policy_type": 0, "max_prefill_batch_size": 50, "max_prefill_tokens": 8192 } }
响应状态码:200
参数 |
类型 |
说明 |
---|---|---|
name |
string |
服务名称,暂定"MindIE Server"。 |
version |
string |
服务版本。 |
extensions |
object |
扩展字段。 |
max_iter_times |
int |
最大可进行的Decode次数。 |
prefill_policy_type |
int |
Prefill阶段的调度策略,详情请参见ScheduleConfig参数说明中的prefillPolicyType参数。 |
decode_policy_type |
int |
Decode阶段的调度策略,详情请请见ScheduleConfig参数说明中的decodePolicyType参数。 |
max_prefill_batch_size |
int |
最大prefill batch size。 |
max_prefill_tokens |
int |
最大prefill token数量。 |