检索向量

本文介绍向量检索服务如何通过控制台、SDK、API三种不同的方式检索向量。

控制台方式

  1. 登录向量检索服务控制台

  2. 在左侧导航栏单击Cluster列表,选中需要检索向量的Collection,单击Collection详情image

  1. 在左侧二级导航栏,单击相似向量搜索,填写相应内容后,单击搜索,即可返回相似向量结果。

    1. 单向量Collection向量检索image向量检索参数设置如下所示

      参数

      对应API参数名称

      说明

      是否必选

      Query Vector

      vector

      向量数据,例如[1.0,2.0,3.0,4.0]。

      说明

      向量维度和数据类型必须与Collection一致。

      过滤条件

      filter

      过滤条件,需满足SQL where子句规范,请参见条件过滤检索

      Partition

      partition

      Partition名称。默认为default,请根据需要选择不同的Partition。

      TopK

      topk

      最大可返回的向量条数。TopK默认10,最大可支持1024。

      返回结果参数说明如下所示。

      参数

      对应API参数名称

      说明

      距离

      score

      向量相似度

      • 不同的距离度量方式,向量间距离的数值表示并不相同,请参见什么是向量

      • 返回结果根据向量相似度降序排列。

      主键ID

      id

      相似向量的主键ID。

      向量

      vector

      向量数据,例如[1.0,2.0,3.0,4.0]

      属性

      fileds

      json字段参数,例如{"price":100,"type":"dress"}

      Partition

      partition

      相似向量所在的partition。

    2. 多向量Collection向量检索image

      说明
      • 点击新增Query Vector,下方会多出一条记录,向量条数不能超过Collection中定义的向量条数。

      • 点击右侧删除按钮,本条记录被删除。

      向量检索参数设置如下所示

      参数

      对应API参数名称

      说明

      是否必选

      向量名称

      {VectorName}

      自定义。需要满足如下要求:

      • 命名长度为3-32个字符。

      • 必须由大小写字母、数字和符号(_,-)组成。例如:vector1、vector_1、vector_a_name。

      • 向量名称在本Collection中必须唯一,不允许两个相同的向量名称同时存在。

      说明
      • 向量名称只能选择创建Collection时填写的向量名称。

      Query Vector

      vector

      向量数据,例如[1.0,2.0,3.0,4.0]。

      说明

      向量维度和数据类型必须与创建Collection时定义的一致。

      候选向量条数

      num_candidates

      单向量召回多少条结果。默认等于topk(10)。

      权重

      Optional[Dict[str, float]

      只有排序方式选择WeightRank时,才需要设置。默认是权重相同1.0:1.0:1.0···,详见WeightedRanker

      排序方式

      RrfRanker/

      WeightedRanker

      支持RRFRank和WeightRank两种方式。详见RrfRankerWeightedRanker

      constant

      rank_constant

      当排序方式选择RRFRank时有效。例如当rank_constant=10,表示每条向量返回10条最相似的结果。默认值为60,详见RrfRanker

      过滤条件

      filter

      过滤条件,需满足SQL where子句规范,请参见条件过滤检索

      Partition

      partition

      Partition名称。默认为default,请根据需要选择不同的Partition。

      TopK

      topk

      最大可返回的向量条数。TopK默认10,最大可支持1024。

      返回结果参数说明如下所示。

      参数

      对应API参数名称

      说明

      距离

      score

      向量相似度

      • 不同的距离度量方式,向量间距离的数值表示并不相同,请参见什么是向量

      • 返回结果根据向量相似度降序排列。

      主键ID

      id

      相似向量的主键ID。

      向量

      vector

      向量数据,例如[1.0,2.0,3.0,4.0]

      属性

      fileds

      json字段参数,例如{"price":100,"type":"dress"}

      Partition

      partition

      相似向量所在的partition。

SDK方式

  • 通过Python SDK检索向量的方式,请参见检索Doc

  • 通过Java SDK检索向量的方式,请参见检索Doc

API方式

通过HTTP API检索向量的方式,请参见检索Doc