AscendIndexInt8Flat
|
- 特征类型:int8
- 特征维度:64, 128, 256, 384, 512, 768, 1024
- 距离类型:L2和IP
- 计算精度:高
- Device内存占用:较低
- 适应场景:精度要求高的暴力检索场景
|
|
链接
|
AscendIndexFlat
|
- 特征类型:FP32
- 特征维度:32, 64, 128, 256, 384, 512, 768, 1024, 2048, 3072, 4096
- 距离类型:L2和IP
- 计算精度:高
- Device内存占用:高
- 适应场景:精度要求高的暴力检索场景
|
|
链接
|
AscendIndexSQ
|
- 特征类型:FP32
- 特征维度:64, 128, 256, 384, 512, 768
- 距离类型:L2和IP
- 计算精度:高
- Device内存占用:较低(已量化为int8)
- 适应场景:精度要求较高的暴力检索场景
|
|
链接
|
AscendIndexCluster
|
- 特征类型:FP32
- 特征维度:32, 64, 128, 256, 384, 512
- 距离类型:IP
- 计算精度:高
- Device内存占用:较高
- 适应场景:只计算距离的聚类场景
- 仅支持Atlas 推理系列产品
|
|
链接
|
IndexIL
|
需要运行在Device上,安装部署复杂,暂不推荐使用
|
|
参考IndexILFlat
|