本文主要介绍向量检索服务的基本概念、产品优势。
前置概念
阅读本文前,您可能需要了解如下概念:
什么是向量检索服务
向量检索服务DashVector基于通义实验室自研的高效向量引擎Proxima内核,提供具备水平拓展能力的云原生、全托管的向量检索服务。DashVector将其强大的向量管理、向量查询等多样化能力,通过简洁易用的SDK/API接口透出,方便被上层AI应用迅速集成,从而为包括大模型生态、多模态AI搜索、分子结构分析在内的多种应用场景,提供所需的高效向量检索能力。
产品地址
产品首页:https://www.aliyun.com/product/ai/dashvector
控制台首页:https://dashvector.console.aliyun.com
产品优势
多维度高精度:依据不同数据维度和分布选择不同算法或算法组合,根据具体场景需求实现精度和性能之间的平衡。
实时在线更新:采用扁平化的索引结构,支持在线大规模向量索引的从0到1的流式构建,实现了索引即增即查、即时落盘,以及实时动态更新。
高性能低成本:有限成本下实现最大化性能并满足业务的需求。
多场景适配:结合超参调优和复合索引等方法,提高系统的自动化能力,以及增强用户的易用性。
超大规模索引构建和检索:引入复合性检索算法,精于工程实现和算法底层优化,低成本实现高效率的检索方法,单片索引可达几十亿的规模。
标签+向量检索:在索引算法层实现了“带条件的向量检索”,解决了传统多路归并召回结果不理想的情况,满足组合检索的要求。
索引水平扩展:采用非对等分片方法实现分布式检索,支持有限精度下索引的快速合并,与Map-Reduce计算模型可有效结合。
异构计算:支持大批量高吞吐的离线检索加速,支持GPU构建邻居图索引,成功实现小批量+低延时+高吞吐的资源利用。
Serverless:支持Serverless能力,为用户提供按需使用、弹性扩缩和免运维的使用体验。