下载
中文
注册
从开放态部署切换到标准态部署后,发现检索性能存在下降情况

从开放态部署切换到标准态部署后,发现检索性能存在下降情况

2025/02/06

19

暂无评分
我要评分

问题信息

问题来源产品大类产品子类关键字
官方模型推理Index SDK开放态、标准态、检索性能

问题现象描述

从开放态部署切换到标准态部署后,在Index的底库、batch较小场景下,检索性能出现下降情况。

解决措施

Index在batch越大时,AI Core的使用率越高,性能也会有所提升。

建议在使用检索功能过程中,尝试使用最优batch获取最佳性能,可通过组batch的方式(参考开源的triton推理服务),通过提高batch的方式进行性能提升。

本页内容