创建Collection

本文介绍向量检索服务如何通过控制台、SDK、API三种不同的方式创建Collection。

控制台方式

  1. 登录向量检索服务控制台

  2. 单击Cluster列表,移动鼠标到Cluster操作栏,单击创建Collectionimage

  1. 填写Collection名称、选择向量设置类型,填写其他相关参数然后单击确定按钮,完成Collection的创建。创建Collection时,只能选择单向量设置或多向量设置其中一种进行创建。

    1. 创建单向量Collectionimage创建Collection参数设置如下所示。

      参数

      对应API参数名称

      说明

      是否必选

      Cluster

      ClusterName

      Cluster名称

      Collection名称

      Name

      待创建的Collection名称。

      说明
      • 命名长度为3-32个字符。

      • 必须由大小写字母、数字和符号(_,-)组成,且必须以字母开头。

      • Collection名称在Cluster内必须唯一,不允许两个相同名称的Collection同时存在。

      • 付费Cluster最多支持创建32个支持Collection;免费Cluster最多支持创建2个Collection。

      地域

      /

      当前支持杭州、北京、上海、深圳和张家口区域。

      Endpoint

      Endpoint

      vrs-cn-xxxxxxx.dashvector.cn-hangzhou.aliyuncs.com

      向量维度

      dimension

      向量维度,最小2,最大20000。

      说明
      • 向量的维度,指向量数组的大小。例如:[1.0,2.0,3.0] 为3维向量,[1.0,2.0,3.0,4.0] 为4维向量,依次类推。

      • 向量维度大小取决于使用模型输出的向量维度。详见什么是向量

      向量数据类型

      dtype

      向量数据类型,指向量数组中元素的数据类型,向量检索服务目前支持"Float"(默认)/"INT8"两种数据类型。例如:[11,22,33,44] 则为INT8型,[1.1,2.2,3.3,4.4] 则为Float型。请根据业务实际情况选择。

      距离度量方式

      metric

      距离度量方式,Cosine/"DotProduct"/"Euclidean"。为Cosine时,向量数据类型必须为Float。详见什么是向量

      Schema

      fields_schema

      详见Schema Free

    2. 创建多向量Collection

      DashVector中一条记录中可支持设置多条向量,并在搜索过程中支持多条向量同时检索。image

      说明
      • 一条Doc最多支持4条向量设置。

      • 点击新增向量,下方会多出一条记录。

      • 点击右侧删除按钮,本条记录被删除。

      创建Collection参数设置如下所示。

      参数

      对应API参数名称

      说明

      是否必选

      Cluster

      ClusterName

      Cluster名称

      Collection名称

      Name

      待创建的Collection名称。

      说明
      • 命名长度为3-32个字符。

      • 必须由大小写字母、数字和符号(_,-)组成,且必须以字母开头。

      • Collection名称在Cluster内必须唯一,不允许两个相同名称的Collection同时存在。

      • 付费Cluster最多支持创建32个支持Collection;免费Cluster最多支持创建2个Collection。

      地域

      /

      当前支持杭州、北京、上海、深圳和张家口区域。

      Endpoint

      Endpoint

      vrs-cn-xxxxxxx.dashvector.cn-hangzhou.aliyuncs.com

      向量名称

      {VectorName}

      自定义。需要满足如下要求:

      • 命名长度为3-32个字符。

      • 必须由大小写字母、数字和符号(_,-)组成。例如:vector1、vector_1、vector_a_name。

      • 向量名称在本Collection中必须唯一,不允许两个相同的向量名称同时存在。

      说明
      • 向量名称只能选择创建Collection时填写的向量名称。

      向量维度

      dimension

      向量维度,最小2,最大20000。

      说明
      • 向量的维度,指向量数组的大小。例如:[1.0,2.0,3.0] 为3维向量,[1.0,2.0,3.0,4.0] 为4维向量,依次类推。

      • 向量维度大小取决于使用模型输出的向量维度。详见什么是向量

      向量数据类型

      dtype

      向量数据类型,指向量数组中元素的数据类型,向量检索服务目前支持"Float"(默认)/"INT8"两种数据类型。例如:[11,22,33,44] 则为INT8型,[1.1,2.2,3.3,4.4] 则为Float型。请根据业务实际情况选择。

      距离度量方式

      metric

      距离度量方式,Cosine/"DotProduct"/"Euclidean"。为Cosine时,向量数据类型必须为Float。详见什么是向量

      Schema

      fields_schema

      详见Schema Free

SDK方式

  • 通过Python SDK创建一个新的Collection的方式,请参见新建Collection

  • 通过Java SDK创建一个新的Collection的方式,请参见新建Collection

API方式

通过HTTP API创建一个新的Collection的方式,请参见新建Collection