AscendIndexIVFSP
|
- 特征类型:FP32
- 特征维度:64, 128, 256, 512, 768
- 距离类型:L2
- 计算精度:中
- Device内存占用:低(压缩特征)
- 适应场景:适用于亿级底库(大库容),对性能要求较高,对精度损失有容忍的近似检索场景。
- 仅支持Atlas 推理系列产品
|
- IVFSP业务算子
- IVFSP AICPU算子
- IVFSP训练算子(仅在需要通过训练生成码本文件时才使用到)
请参见IVFSP。
|
链接
|
AscendIndexIVFSQ
|
- 特征类型:FP32
- 特征维度:64, 128, 256, 384, 512
- 距离类型:L2和IP
- 计算精度:中
- Device内存占用:较低(量化为int8)
- 适应场景:IVFSQ算法作为性能-精度调节器,适用于对精度损失有容忍,但是对性能要求比较高的场景。
|
|
链接
|
AscendIndexIVFSQT
|
- 特征类型:FP32
- 特征维度:256
- 距离类型:IP
- 计算精度:中
- Device内存占用:低(量化和降维)
- 适应场景:AscendIndexIVFSQT包含降维算法的三级检索IVFSQ算法,适用于亿级底库(大库容),对性能要求较高,对精度损失有容忍的近似检索场景。
|
|
链接
|
AscendIndexBinaryFlat
|
- 特征类型:uint8二值化特征
- 特征维度:256, 512, 1024
- 距离类型:Hamming和IP
- 计算精度:高
- Device内存占用:低
- 适应场景:AscendIndexBinaryFlat类继承自faiss的IndexBinary类,用于二值化特征检索。对于对内存占用要求较低,性能要求较高的场景。
- 仅支持Atlas 推理系列产品
|
|
链接
|
AscendIndexVStar
|
- 特征类型:FP32
- 特征维度:128, 256, 512, 1024
- 距离类型:L2
- 计算精度:中
- Device内存占用:低(压缩特征)
- 适应场景:适用于千万级底库(大库容),对性能要求较高,对精度损失有容忍的近似检索场景。
- 仅支持Atlas 推理系列产品
|
- VStar业务算子
- VStar AICPU算子
- VStar训练算子(仅在需要通过训练生成码本文件时才使用到)
请参见VSTAR。
|
链接
|
AscendIndexGreat
|
- 特征类型:FP32
- 特征维度:128, 256, 512, 1024
- 距离类型:L2
- 计算精度:中
- Device内存占用:低(压缩特征)
- 适应场景:适用于千万级底库(大库容),对性能要求较高,对精度损失有容忍的近似检索场景。
- 仅支持Atlas 推理系列产品
|
(当mode为“AKMode”时,才需要生成算子)
- VStar业务算子
- VStar AICPU算子
- VStar训练算子(仅在需要通过训练生成码本文件时才使用到)
请参见VSTAR。
|
链接
|