AscendIndexInt8FlatConfig
API定义 |
AscendIndexInt8FlatConfig(uint32_t blockSize =BLOCK_SIZE, Int8IndexMode indexMode = Int8IndexMode::DEFAULT_MODE); |
---|---|
功能描述 |
AscendIndexInt8FlatConfig的构造函数,生成AscendIndexInt8FlatConfig,此时根据Devices中配置的值设置Device侧昇腾AI处理器资源,配置资源池大小。配置Device侧blockSize,配置int8的检索模式。 |
输入 |
std::initializer_list<int> devices:Device侧设备ID。 int64_t resourceSize:设备侧预置的内存池大小,单位为Byte,计算过程中存储中间结果的内存空间,用于避免计算过程中动态申请内存造成性能波动。默认参数为头文件中的“INT8_FLAT_DEFAULT_MEM”。该参数通过底库大小和search的batch数共同确定,在底库大于等于1000万且batch数大于等于16时建议设置1024MB。 uint32_t blockSize:配置Device侧的blockSize,约束tik算子一次计算的数据量,以及底库分片存储每片存储向量的size。默认值“BLOCK_SIZE”为16384 * 16 = 262144。 Int8IndexMode indexMode:配置Index int8检索模式。默认值为DEFAULT_MODE。
|
输出 |
无 |
返回值 |
无 |
约束说明 |
|