查询服务元数据信息。
操作类型:GET
URL:https://{ip}:{port}/v2
无
请求样例:
GET https://<ip>:<port>/v2
响应样例:
{ "name": "MindIE Server", "version": "{version}", "extensions": { "max_iter_times": 512, "prefill_policy_type": 0, "decode_policy_type": 0, "max_prefill_batch_size": 50, "max_prefill_tokens": 8192 } }
响应状态码:200
参数 |
类型 |
说明 |
---|---|---|
name |
string |
服务名称,暂定"MindIE Server"。 |
version |
string |
服务版本。 |
extensions |
object |
扩展字段。 |
max_iter_times |
int |
最大可进行的decode次数。 |
prefill_policy_type |
int |
prefill阶段的调度策略。 |
decode_policy_type |
int |
decode阶段的调度策略。 |
max_prefill_batch_size |
int |
最大prefill batch size。 |
max_prefill_tokens |
int |
最大prefill token数量。 |