


















近日,亚马逊云科技宣布新一代 Amazon OpenSearch Serverless 正式上线。其架构经过重新设计,资源调配速度比上一代无服务器架构快 20 倍,具备真正的“缩减至零”能力,而且在应对峰值负载时,成本比预配置集群低达 60%。
该公司表示,他们对该服务的定位是开发代理型 AI 应用的基础组件。该服务不仅与 Cursor 和 Kiro 等集成 AI 开发环境实现了深度集成,还新增了连接和管理 OpenSearch Serverless 资源的功能。用户可通过 Web 控制台、AWS SDK 和 AWS CLI 开始创建新的集合,对 AWS CloudFormation 的支持也即将推出。
Amazon OpenSearch Serverless 是一项完全托管的服务,可以让工程师在 AWS 云端运行和扩展文本及向量搜索引擎。该服务基于开源搜索和可观测性套件 OpenSearch。
亚马逊云科技表示,他们对 OpenSearch Serverless 的定位是代理式 AI 工作负载的基础构建模块,并提供与 Vercel 和 Kiro 等 AI 开发平台的原生集成。此外,亚马逊云科技还向 OpenSearch Agent Skills 贡献了专用技能,使开发者能够通过 Claude Code、Cursor 和 Codex 等流行的 AI 辅助编码平台来配置和管理 OpenSearch 资源。
亚马逊云科技还在 Vercel 中扩展了对 OpenSearch Serverless 的支持。开发 AI 代理应用的开发者可以直接通过 Vercel 控制台使用该功能,创建新的无服务器集合或连接到现有集合。
在他们的博文中,亚马逊云科技高级解决方案架构师 Sohaib Katariwala、亚马逊云科技高级分析与 AI 解决方案架构师 Arjun Nambiar 以及 Amazon OpenSearch Service 产品经理 Raj Ramasubbu 详细介绍了他们是如何重新审视该服务以实现这些改进的。作者介绍了两种架构:Classic(经典架构,现有集合将引用该架构)和 NextGen(新一代架构,将作为创建新集合时的默认选项,并受益于这些改进)。

Amazon OpenSearch Serverless 架构
NextGen 架构中新增的共享存储层将计算单元(称为 OpenSearch 容量单元,简称 OCU)与存储解耦。这使得 OCU 成为无状态的。这有两个实际的好处:快速配置和高效缩容。
得益于快速配置,OCU 无需初始化本地磁盘,就可以在数秒钟内开始处理请求。共享存储直接挂载在 OCU 上。
在高效缩容方面,由于数据并不存储在 OCU 中,所以可以释放闲置的容量而不会影响用户数据。
新架构还在 on.aws 域名下引入了两种新的端点格式,二者均采用 AWS PrivateLink,支持创建虚拟私有云(VPC)端点,以便可以从用户的 VPC 或本地基础设施进行内部访问。
每个集合的端点(.aoss..on.aws)工作方式与之前一样,每个端点仅提供对一个集合的访问。
新增的账户级区域端点(.aoss. .on.aws) 则允许用户通过单个主机名访问所有集合;用户可通过 x-amz-aoss-collection-id 或 x-amz-aoss-collection-name 头指定目标集合。该新端点有助于优化网络资源管理,例如使用单一连接池和传输层安全 (TLS) 会话。
在创建和管理新的 NextGen 集合时,2026 年 2 月推出的集合组正发挥着越来越重要的作用。无论是 Classic 还是 NextGen,其版本都仅在组这一级上设定,并适用于该组内创建的所有集合。此外,用户还可以利用集合组在多个集合之间共享计算资源,降低小型工作负载的成本。
用户可以通过控制台、AWS SDK 或 AWS CLI 创建 NextGen 集合。亚马逊云科技表示,对 AWS CloudFormation 的支持也即将推出。
在通过控制台创建时,除了标准方法外,还有一种简化的“快速创建”方法,提供了合理的默认设置。
Amazon OpenSearch Serverless 介于传统搜索平台与新兴的以 AI 为重点的数据存储之间。其最直接的竞争对手是 Elasticsearch Serverless,后者提供了类似的托管搜索和分析功能。对于已经采用 Postgres 的团队而言,支持 pgvector 的 PostgreSQL 提供了一种更简单的数据库中心化方案;而 Pinecone 等专业向量数据库则专注于为 AI 和 RAG 工作负载提供高性能相似度搜索。这些选项体现了搜索功能、运维简便性和 AI 优化之间的不同权衡取舍。
使用 AWS SDK 或 AWS CLI 进行创建时,需要先创建集合组,然后再创建集合,无法享受控制台提供的简化操作体验。
aws opensearchserverless create-collection-group \--name articles-cg \--generation NEXTGEN \--standby-replicas ENABLED \--capacity-limits "minIndexingCapacityInOCU=0,maxIndexCapacityInOCU=4,minSearchCapacityInOCU=4,maxSearchCapacityInOCU=2"aws opensearchserverless create-collection \--name articles-vectors \--type VECTORSEARCH \--collection-group-name articles-cg 复制代码
在社交媒体平台上,用户对“缩减至零”功能的推出表示欢迎,并指出,该功能曾经是用户在小规模应用场景中使用该服务时的主要痛点之一。
这意义重大,此前我们不得不借助 Algolia 等解决方案才能实现真正的无服务器搜索数据库。
现在,我们也可以开始在小型应用中使用 OpenSearch 了。
也有人警告说,缩减至零会带来一些取舍,例如冷启动,团队必须评估这些因素对应用程序的影响。
[…] 闲置成本更低且多租户支持更佳,但团队仍需针对冷启动和初始化延迟做好规划。
新一代 Amazon OpenSearch Service 已经在所有已经提供 Amazon OpenSearch Serverless 的 AWS 商业区域上线。用户需按 OCU 计费,费用涵盖搜索、索引和 GPU 加速所使用的计算资源。存储费用则按 GB-月单独计费。
原文链接:https://www.infoq.com/news/2026/06/aws-opensearch-serverless/
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。