下载
中文
注册
TGI并发请求返回结果异常

TGI并发请求返回结果异常

2024/02/21

174

暂无评分
我要评分

问题信息

问题来源产品大类产品子类关键字
官方模型推理开发工具llama-13b、 TGI推理框架

问题现象描述

llama-13b部署TGI推理框架后,跑8个串行请求时返回结果正常,跑8个并行请求时返回结果异常。

图1 跑8个串行请求时返回结果正常
图2 跑8个并行请求时返回结果异常

原因分析

config文件中的model_type取值为xverse,开发时适配内容没写这种type。

解决措施

将config文件中的model_type取值改为llama。

本页内容