向量检索服务产品规格

本文介绍向量检索服务DashVector的产品规格,以帮助用户选择贴合自身业务场景的实例规格。

实例类型

向量检索服务DashVector当前支持四种实例(Cluster)类型,以支持不同的业务场景和需求:

  • 性能型:适用于查询QPS高、查询延迟低的场景,同时性能型也是写入效率最高的实例类型。对于高并发、大流量、低延迟场景,或对写入效率有较高的要求的场景,可选择性能型实例。

  • 存储型(推荐):存储型相对于性能型有5倍的存储容量优势,能够存储和管理更多的向量数据,适用于大规模数据量的场景。存储型实例同样也具备优秀的技术指标,可满足大部分场景需求,同时也是性价比最高的实例类型,推荐用户选择使用。

  • Serverless型:不限数据容量,基于用户数据自动扩缩,按实际请求收费,适用于低频QPS查询(QPS<2),延迟不敏感等场景。总体性能与存储型实例接近。

  • 免费试用:适用于测试、体验场景,请勿用于线上生产环境。免费试用实例有效期为1个月,到期后可再次申请试用。免费实例有部分试用限制,详情可参考约束与限制

重要

免费试用实例有效期为1个月,到期后免费试用实例将自动释放,实例中的数据将被全部删除并清空且不可恢复,为了保证实例可持续使用,请您于创建免费试用实例之后的30个自然日内将免费试用实例升级为付费实例。免费试用实例由于到期且没有升级为付费实例而导致的数据被删除的情况,阿里云将不承担相关责任。

实例规格

向量检索服务DashVector针对性能型和存储型实例提供不同档位的实例(Cluster)规格,不同规格的主要区别在于存储容量的不同。Serverless实例与已有性能型和存储型不同,无容量限制。

说明

若您有更高规格需求,或有任何反馈、期望获取更多技术支持,欢迎通过如下方式联系我们:

  • 官方钉钉群:25130022704

  • 技术支持邮箱:dashvector@service.aliyun.com

存储容量参考

实例类型

实例规格

Doc容量参考(基于768维FP32向量数据)

Doc容量参考(基于1536维FP32向量数据)

性能型

P.small

500,000

250,000

P.large

1,000,000

500,000

P.2xlarge

2,000,000

1,000,000

P.4xlarge

4,000,000

2,000,000

P.8xlarge

8,000,000

4,000,000

P.16xlarge

16,000,000

8,000,000

存储型

S.small

2,500,000

1,250,000

S.large

5,000,000

2,500,000

S.2xlarge

10,000,000

5,000,000

S.4xlarge

20,000,000

10,000,000

S.8xlarge

40,000,000

20,000,000

S.16xlarge

80,000,000

40,000,000

Serverless型

Serverless

不限

不限

重要
  1. 以上数据均已通过实际测试验证,但仅供参考!

  2. 上述用于容量测试的Doc中不包含任何Fields,仅包含主键和向量数据,主键为从零开始自增正整数转字符串。大部分实际生产场景中,Fields是不可或缺的,Fields数据同样会占用存储空间,从而导致实际存储的Doc数低于上述表格。

检索性能参考

实例类型

实例规格

topk=10

topk=100

topk=250

topk=1000

QPS

RT_p99

QPS

RT_p99

QPS

RT_p99

QPS

RT_p99

性能型

P.large(基于1百万768维FP32向量数据)

962.6

<30ms

429.7

<30ms

387.5

<45ms

134.7

<250ms

存储型

S.large(基于5百万768维FP32向量数据)

297.6

<30ms

112.5

<30ms

107.4

<50ms

37.1

<300ms

重要
  1. 以上数据为基于Cohere数据集实测结果,但由于不同数据集的数据分布对性能有影响,上述数据仅供参考。

  2. 上述用于性能测试的Doc中不包含任何Fields,仅包含主键和向量数据,主键为从零开始自增正整数转字符串。

  3. 向量检索服务DashVector会定时在后台进行向量索引优化,通常在写入完成后4小时完成,届时性能达到最优状态。

  4. 不同规格在写满数据情况下,QPS与上述表格中保持一致或更高,不因数据量的增加而下降。如,P.2xlarge规格,在写满2百万768维FP32向量数据情况下,topk=100的QPS可达到600+。

副本数

向量检索服务DashVector支持调整副本数,可选范围为1-5。副本之间数据完全相同,副本数越大,可支持的QPS越高,呈线性关系。同时副本数越大,服务可用性越高,建议对可用性有较高要求的生产环境选择>=2的副本数

说明
  • 需要注意,副本数的增加和减少不会影响存储容量,仅影响QPS和可用性。

  • Serverless实例无副本概念,由系统管理。