下载
中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助
昇腾小AI

VSTAR

VSTAR检索当前只支持Atlas 推理系列产品,涉及VSTAR业务算子模型文件(vstar_generate_models.py)生成,具体请参见VSTAR

算子生成环境需要跟码本生成保持一致,具体请参见总体说明

VSTAR业务算子模型文件生成

用法

python3 vstar_generate_models.py --dim <dim> --nlistL1 <nlist1> --subDimL1 <sub_dim1> --nProbeL1 <nprobe1> --nProbeL2 <nprobe2> --segmentNumL3 <segment> --pool <pool_size>

参数名称

<dim>:特征向量维度,默认值为“256”。

<nlist1>:一级簇聚类中心个数。默认值为“1024”。

<nprobe1>:检索时每次下发计算时的一级候选桶数量,默认值为“[72]”。

<nprobe2>:检索时每次下发计算时的二级候选桶数量,默认值为“[64, 296]”。

<sub_dim1>:检索时一级降维后的维度大小,默认值为“32”。

<segment>:检索时从nprobe2中用于搜索数据段数,默认值“[512, 1000, 1504]”。

<pool_size>:进程数量,默认“16”。

--help | -h:查询帮助信息。

说明

执行此命令,用户可以得到一组用于VSTAR检索时的AI Core和AI CPU算子模型文件,用户需要自行修改命令中参数。

约束说明

  • dim ∈ {128,256,512,1024}。
  • nlist1 ∈ {256,512,1024}。
  • sub_dim1 ∈ {32,64,128}。sub_dim1必须小于dim。
  • nprobe1 ∈ (16, nlist1]。nprobe1是int类型的列表,且列表中的数值必须是8的整数倍。
  • nprobe2 ∈ (16, nprobe1 * n]。当dim为1024时n为16,其余维度n为32,nprobe2是int类型的列表,且列表中的数值必须是8的整数倍。
  • segment ∈ (100, 5000]。segment是int类型的列表,且segment必须是8的整数倍。
  • pool_size∈[1, 32]。运行脚本前请先确定宿主机最大能支持的进程数量合理设置。
搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词