下载
中文
注册

AscendIndexInt8FlatConfig

API定义

AscendIndexInt8FlatConfig(uint32_t blockSize =BLOCK_SIZE, Int8IndexMode indexMode = Int8IndexMode::DEFAULT_MODE);

功能描述

AscendIndexInt8FlatConfig的构造函数,生成AscendIndexInt8FlatConfig,配置Device侧blockSize,配置int8的检索模式。

输入

uint32_t blockSize:配置Device侧的blockSize,约束tik算子一次计算的数据量,以及底库分片存储每片存储向量的size。默认值“BLOCK_SIZE”为16384 * 16 = 262144。

Int8IndexMode indexMode:配置Index int8检索模式。默认值为DEFAULT_MODE

  • DEFAULT_MODE模式,默认模式。
  • PIPE_SEARCH_MODE模式,该模式针对batch大于或等于128的场景做了性能优化。使用该模式时,建议resourceSize至少配置为1324MB
  • WITHOUT_NORM_MODE模式,暂时不支持本模式。

输出

返回值

约束说明

  • “blockSize”可配置的值的集合为{ 16384, 32768, 65536, 131072, 262144 }
  • “indexMode” 中PIPE_SEARCH_MODE模式下的AscendIndexInt8Flat仅支持METRIC_L2。