下载
中文
注册

近似检索

近似检索算法介绍

算法(API参考)

算法使用场景

需要生成的算子

样例链接

AscendIndexIVFSP

  • 特征类型:FP32
  • 特征维度:64, 128, 256
  • 距离类型:L2
  • 计算精度:中
  • Device内存占用:低(压缩特征)
  • 适应场景:适用于亿级底库(大库容),对性能要求较高,对精度损失有容忍的近似检索场景。
  • IVFSP业务算子
  • IVFSP AICPU算子
  • IVFSP训练算子(仅在需要通过训练生成码本文件时才使用到)

请参见IVFSP

链接

AscendIndexIVFSQ

  • 特征类型:FP32
  • 特征维度:64, 128, 256, 384, 512
  • 距离类型:L2和IP
  • 计算精度:中
  • Device内存占用:较低(量化为int8)
  • 适应场景:IVFSQ算法作为性能-精度调节器,适用于对精度损失有容忍,但是对性能要求比较高的场景。
  • IVFSQ8
  • AICPU
  • FlatAT(仅在参数useKmeansPP设置为true的时候需要生成FlatAT算子)

链接

AscendIndexIVFSQT

  • 特征类型:FP32
  • 特征维度:256
  • 距离类型:IP
  • 计算精度:中
  • Device内存占用:低(量化和降维)
  • 适应场景:AscendIndexIVFSQT包含降维算法的三级检索IVFSQ算法,适用于亿级底库(大库容),对性能要求较高,对精度损失有容忍的近似检索场景。

链接

AscendIndexBinaryFlat

  • 特征类型:uint8二值化特征
  • 特征维度:256, 512, 1024
  • 距离类型:Hamming
  • 计算精度:高
  • Device内存占用:低
  • 适应场景:AscendIndexBinaryFlat类继承自faiss的IndexBinary类,用于二值化特征检索。对于对内存占用要求较低,性能要求较高的场景。
  • 仅支持Atlas 推理系列产品

链接