下载
中文
注册

全量检索

全量检索算法介绍

算法(API参考)

算法使用场景

需要生成的算子

样例链接

AscendIndexInt8Flat

  • 特征类型:int8
  • 特征维度:64, 128, 256, 384, 512, 1024
  • 距离类型:L2和IP
  • 计算精度:高
  • Device内存占用:较低
  • 适应场景:精度要求高的暴力检索场景

链接

AscendIndexFlat

  • 特征类型:FP32
  • 特征维度:32, 64, 128, 256, 384, 512, 1024,2048(仅L2)
  • 距离类型:L2和IP
  • 计算精度:高
  • Device内存占用:高
  • 适应场景:精度要求高的暴力检索场景

链接

AscendIndexSQ

  • 特征类型:FP32
  • 特征维度:64, 128, 256, 384, 512
  • 距离类型:L2和IP
  • 计算精度:高
  • Device内存占用:较低(已量化为int8)
  • 适应场景:精度要求较高的暴力检索场景

链接

AscendIndexCluster

  • 特征类型:FP32
  • 特征维度:32, 64, 128, 256, 384, 512
  • 距离类型:IP
  • 计算精度:高
  • Device内存占用:较高
  • 适应场景:只计算距离的聚类场景
  • 仅支持Atlas 300I Pro 推理卡

链接

IndexIL

需要运行在Device上,安装部署复杂,暂不推荐使用

参考IndexILFlat