近似检索 近似检索算法介绍 算法(API参考) 算法使用场景 需要生成的算子 样例链接 AscendIndexIVFSP 特征类型:FP32特征维度:64, 128, 256距离类型:L2计算精度:中Device内存占用:低(压缩特征)适应场景:适用于亿级底库(大库容),对性能要求较高,对精度损失有容忍的近似检索场景。仅支持Atlas 推理系列产品 IVFSP业务算子IVFSP AICPU算子IVFSP训练算子(仅在需要通过训练生成码本文件时才使用到) 请参见IVFSP。 链接 AscendIndexIVFSQ 特征类型:FP32特征维度:64, 128, 256, 384, 512距离类型:L2和IP计算精度:中Device内存占用:较低(量化为int8)适应场景:IVFSQ算法作为性能-精度调节器,适用于对精度损失有容忍,但是对性能要求比较高的场景。 IVFSQ8AICPUFlatAT(仅在参数useKmeansPP设置为true的时候需要生成FlatAT算子) 链接 AscendIndexIVFSQT 特征类型:FP32特征维度:256距离类型:IP计算精度:中Device内存占用:低(量化和降维)适应场景:AscendIndexIVFSQT包含降维算法的三级检索IVFSQ算法,适用于亿级底库(大库容),对性能要求较高,对精度损失有容忍的近似检索场景。 IVFSQTFlatATAICPUFlatInt8AT(在Atlas 推理系列产品上时需要生成) 链接 AscendIndexBinaryFlat 特征类型:uint8二值化特征特征维度:256, 512, 1024距离类型:Hamming和IP计算精度:高Device内存占用:低适应场景:AscendIndexBinaryFlat类继承自faiss的IndexBinary类,用于二值化特征检索。对于对内存占用要求较低,性能要求较高的场景。仅支持Atlas 推理系列产品。 BinaryFlatAICPU 链接 AscendIndexVStar 特征类型:FP32特征维度:128, 256, 512, 1024距离类型:L2计算精度:中Device内存占用:低(压缩特征)适应场景:适用于千万级底库(大库容),对性能要求较高,对精度损失有容忍的近似检索场景。仅支持Atlas 推理系列产品。 VStar业务算子VStar AICPU算子VStar训练算子(仅在需要通过训练生成码本文件时才使用到)请参见VSTAR。 链接 AscendIndexGreat 特征类型:FP32特征维度:128, 256, 512, 1024距离类型:L2计算精度:中Device内存占用:低(压缩特征)适应场景:适用于千万级底库(大库容),对性能要求较高,对精度损失有容忍的近似检索场景。仅支持Atlas 推理系列产品。 (当mode为“AKMode”时,才需要生成算子) VStar业务算子VStar AICPU算子VStar训练算子(仅在需要通过训练生成码本文件时才使用到) 请参见VSTAR。 链接 父主题: 算法介绍