惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

博客园 - 聂微东
W
WeLiveSecurity
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
T
The Blog of Author Tim Ferriss
博客园 - Franky
IT之家
IT之家
博客园_首页
I
Intezer
罗磊的独立博客
有赞技术团队
有赞技术团队
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
S
Schneier on Security
GbyAI
GbyAI
人人都是产品经理
人人都是产品经理
V
V2EX
V
Visual Studio Blog
A
Arctic Wolf
Y
Y Combinator Blog
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
C
Cybersecurity and Infrastructure Security Agency CISA
M
MIT News - Artificial intelligence
T
Tailwind CSS Blog
G
Google Developers Blog
酷 壳 – CoolShell
酷 壳 – CoolShell
H
Help Net Security
Recent Announcements
Recent Announcements
量子位
Simon Willison's Weblog
Simon Willison's Weblog
D
DataBreaches.Net
博客园 - 叶小钗
宝玉的分享
宝玉的分享
AWS News Blog
AWS News Blog
P
Privacy International News Feed
A
About on SuperTechFans
Microsoft Azure Blog
Microsoft Azure Blog
T
The Exploit Database - CXSecurity.com
The Cloudflare Blog
雷峰网
雷峰网
The GitHub Blog
The GitHub Blog
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
P
Privacy & Cybersecurity Law Blog
Security Latest
Security Latest
L
LINUX DO - 热门话题
T
Tor Project blog
The Register - Security
The Register - Security
C
Cyber Attacks, Cyber Crime and Cyber Security
Apple Machine Learning Research
Apple Machine Learning Research
大猫的无限游戏
大猫的无限游戏
D
Darknet – Hacking Tools, Hacker News & Cyber Security
T
Threat Research - Cisco Blogs

InfoQ - 促进软件开发领域知识与创新的传播

Meta 收购 Manus 这事儿泡汤了 5.5万 Star 开源项目 Ghostty 被迫出走,GitHub 正在终结一代技术人的乌托邦 Slack 长时运行多智能体系统的上下文管理方案 从 T+1 到分钟级:金城银行基于 Apache Doris 构建高可靠、强一致的实时数据平台 谷歌云推出 Agents CLI,简化 AI 智能体开发全流程 Claude官方击穿高薪、高学历的安全防线!Anthropic点名10大高危职业,但有群人暂时稳了 亚马逊云科技终止 WorkMail 服务,并将 App Runner 转入维护模式 OPPO小布记忆:全模态碎片化内容的理解与智能整理实践|AICon上海 模力工场038周AI应用周榜:工具在消失,工作流在出现 Akamai CEO Tom Leighton:Agent 时代来临,云基础设施正从“中心化”转向“分布式边缘” 日均数百亿入库背后:从“人肉调度”到K8s弹性架构,度小满金融基于OceanBase重构入库架构实践 百度文库网盘发布GenFlow 4.0:月活用户超1亿,要把网盘变成全端AI工作台 Altman 投的 Agent 终端 Warp 开源了!斩获3.5万star 哪些客户需要拒, 敢让龙虾决定吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 从开发到生产:为什么越来越多的机器学习团队纷纷迁移到 Snowflake | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 探索多智能体工作流:LangGraph Snowflake Cortex AI | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 腾讯云分布式缓存数据库:AI Agent - 从提示词工程到 Harness 工程 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 基于 Streamlit 为 CSV 数据构建分析智能体 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 AI 智能体:告别文档缺漏 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 构建 AI 驱动的数据管道:深度探讨 Snowflake Openflow 与非结构化数据 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 云端太贵、本地不够聪明,英特尔押注“端云混合AI”:智能体PC会替人完成工作 不到10%的存储投入,可能拖垮90%的GPU投资!IBM把AI Agent塞进存储系统,算清企业最容易忽略的一笔账 Snowpark 上手实战 | BUILD 2025_大数据_王玮_InfoQ精选视频 ClickHouse + Langfuse,构建 Agent 可观测基石 腾讯云分布式缓存数据库:Cluster Proxy 共享连接架构深度解析 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 AI 写代码太烧钱了:Copilot、Claude 一起涨价,不如把程序员请回来? 英特尔发布至强600系列工作站处理器与锐炫Pro B70 GPU,全新AI工作站来了 腾讯云分布式缓存数据库:从 Redis 到 Valkey - 开源社区如何快速创新 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 印奇这次要“从0重做”智驾模型!首谈阶跃和千里双公司布局:中国AI商业闭环要靠车跑出来 从Cursor返聘归来,90后华裔女高管带Claude开启日更模式:token成本比工程师工资低多了! 从 Coding 到 Agent:QCon 北京 2026 全景复盘,优秀出品人 & 明星讲师名单揭晓 全链路支撑大模型国产化“Day 0适配”,商汤大装置构建全栈能力底座 凌晨,OpenAI 与亚马逊云科技史上最大联合发布来了 HashiCorp Vault 2.0 发布:引入新身份联邦机制,迈入 IBM 生命周期体系 Yelp 实现超 1,000 个 Cassandra 节点零停机升级 写了 17 年开源代码,我为什么认为 Coding Agents 堆功能是在瞎折腾? 基于 Apache Camel 编排智能体与多模态 AI 管道 面向智能体与人类用户的AI记忆系统:架构设计与核心场景实践|AICon上海 Anthropic 推出 Managed Agents,简化 AI 代理部署流程 阿里HappyHorse开启灰测,720P视频生成低至0.44元/秒 讯飞联合清华团队押注量子AI:不看营收、不设KPI,一群“无人区”科学家,抢夺下代AI算力入口 小米万亿模型全面开源:MIT 协议、1M 上下文,但还是打不过 DeepSeek Cortex Code 入门指南:面向数据工程师的实践路径 | 技术实践 openJiuwen社区首发Team Skills,定义Coordination Engineering新范式 用 Snowflake Cortex Agents 释放结构化数据的最大价值 | 技术实践 Grafana 利用 Kafka 对 Loki 进行了架构重构,并发布了一款命令行工具,旨在将可观测性引入编码代理 ClickHouse重构全文索引:对象存储上跑出高性能 Full-Text Search 可观测性和遥测技术如何提升软件工程实践 Dropbox 与 GitHub 合作,将单体库大小从 87GB 缩减至 20GB Agent 的下一站:基于长期记忆系统 EverOS 的自我演进|AICon上海 同一赛道,四种收费:Agent 控制层(Harness)开始分裂 Cloudflare Sandboxes 正式发布,为 AI 代理提供持久化隔离环境 Agent 的“记忆断片”困局,该怎么破?_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选视频 数据分析师如何快速建立在 AI 时代最值钱的能力:一份可落地的行动路线图 摩尔线程最新财报:研发占比超86%,万卡级大规模智算集群落地 当云区域失效:地缘动荡环境下的高可用重构 Slack 重构通知系统,设置参与度提升 5 倍 智能体工程的隐性技术债务 “我把所有模型都换成了DeepSeek V4”:月账单将降 90%,效果还更好 阿里云智能集团高级技术专家刘少伟已确认出席AICon上海站,并分享如何构建企业 Agent 的自动化行动架构 构建生产就绪的 tRPC API:Apollo Federation 的 TypeScript 替代方案 Anthropic推出面向Claude Code的基于智能体的代码审查功能 北京车展直击:斑马智能甩出车载Agent短剧,比亚迪率先落地,AI让智能座舱又热起来了 Snowflake 作为智能体运行时:从静态管道迈向自主数据系统 | 技术实践 Snowflake 上的本体体系:基于 Cortex Code 能力实现从架构到部署 | 技术实践 Cloudflare 公布 MCP 架构方案,应对企业面临的安全与治理风险 复杂的项目管理怎么做到「AI 友好」?飞书项目用「开放」给出答案 Snowflake Cortex Code 的规范驱动开发:将 SDLC 方法论引入 AI 辅助工作流 | 技术实践 Copilot 不让注册了:从“随便用”到“全面限”,agent 把原有订价模型顶穿了 当互联网用AI卷效率时,这家公司先问了一连串“能不能” Meta 开始记录员工每一次点击:AI 要接管工作,先监控会工作的人 Meta“Token榜”逼疯打工人,一夜烧掉公司几万刀!AI时代Token焦虑越来越离谱 智源FlagOS完成DeepSeek-V4-Flash在八款芯片Day0适配,实现三重技术突破 DeepSeek V4 重磅开源!首次打通华为Ascend,也没丢掉英伟达,百万上下文夺回国产模型话语权 李志飞的“新实验”:当超级个体撞上真实组织 GPT-5.5 登顶时刻,Anthropic 亲口承认 Claude 变笨了!网友群嘲:太敷衍 那些没空写的小需求,龙虾真能做吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 从 Pandas 到生产:使用任意 IDE 进行可扩展的 ML 数据管道与分布式处理 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 pnpm 11 候选版本发布,带来 ESM 分发、供应链默认设置以及新的存储格式 银行业PDF表格提取方案重构:基于Java的分层方案 GPT-5.5 赢了 Opus 4.7 和 Mythos?奥特曼晒黄仁勋内部信:英伟达全员用上 Codex! Cloudflare 推出 Think:一款面向 AI 代理的持久化运行时 1850亿美元天价支出、75%代码由AI生成!谷歌正式宣告:全面转向智能体工作流 xAI落后太多,马斯克“开大”重金求购Cursor,100亿美金“分手费”都敢签! Pulumi 新增对 Bun 运行时的全面支持 姚顺雨腾讯模型首秀!不卷参数只做 “听话打工人”,Hy3 preview登场 | 附实测 老板让你“忽悠”投资人,你敢发给龙虾吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 Gemini CLI 引入子代理机制,实现任务委派与并行代理工作流 清华系团队星工聚将完成数千万天使轮融资,轮式机器人拿下头部制造企业亿级大单 Pretext.js 绕过 DOM 布局重排,实现 120 FPS 的高级交互体验 靠“AI 云”爆红的 Vercel,栽在一个第三方AI工具手里!IPO前夕遭黑,200万美元赎金谈崩? 高能研讨会|端侧 AI 正在重写实时感知效率上限_AI&大模型_王玮_InfoQ精选视频 2050大会看这篇就够了|报名、交通食宿指引大全 Java 近期资讯:OpenJDK JEP、Jakarta EE 12、Spring Framework、Micrometer、Camel、JBang 金融智能的架构编排:基于 Snowflake Cortex Agents 实现结构化与非结构化数据统一分析 | 技术实践 在AK大神爆火的任务里,摸清国产AI真实水平 百灵Ling-2.6-flash 正式发布:高 Token 效率,以 1/10 消耗实现 SOTA 级 Agent 能力 当 PM 懂AI,当技术懂产品:AI 时代产品力的双向进化|PM x AI产品力领航者大会即将开幕 为 AI 智能体设计记忆机制:揭秘 LinkedIn 的认知记忆智能体 获奖名单公布|2026主题征文第一期|分享你最有价值的龙虾场景与核心 Skill_热门活动_InfoQ写作社区官方_InfoQ写作社区
亚马逊云科技发布新一代 Amazon OpenSearch Serverless
作者:Gianmarco Nalin平川 · 2026-06-16 · via InfoQ - 促进软件开发领域知识与创新的传播

近日,亚马逊云科技宣布新一代 Amazon OpenSearch Serverless 正式上线。其架构经过重新设计,资源调配速度比上一代无服务器架构快 20 倍,具备真正的“缩减至零”能力,而且在应对峰值负载时,成本比预配置集群低达 60%。

该公司表示,他们对该服务的定位是开发代理型 AI 应用的基础组件。该服务不仅与 Cursor 和 Kiro 等集成 AI 开发环境实现了深度集成,还新增了连接和管理 OpenSearch Serverless 资源的功能。用户可通过 Web 控制台、AWS SDK 和 AWS CLI 开始创建新的集合,对 AWS CloudFormation 的支持也即将推出。

Amazon OpenSearch Serverless 是一项完全托管的服务,可以让工程师在 AWS 云端运行和扩展文本及向量搜索引擎。该服务基于开源搜索和可观测性套件 OpenSearch

亚马逊云科技表示,他们对 OpenSearch Serverless 的定位是代理式 AI 工作负载的基础构建模块,并提供与 VercelKiro 等 AI 开发平台的原生集成。此外,亚马逊云科技还向 OpenSearch Agent Skills 贡献了专用技能,使开发者能够通过 Claude CodeCursorCodex 等流行的 AI 辅助编码平台来配置和管理 OpenSearch 资源。

亚马逊云科技还在 Vercel 中扩展了对 OpenSearch Serverless 的支持。开发 AI 代理应用的开发者可以直接通过 Vercel 控制台使用该功能,创建新的无服务器集合或连接到现有集合。

在他们的博文中,亚马逊云科技高级解决方案架构师 Sohaib Katariwala、亚马逊云科技高级分析与 AI 解决方案架构师 Arjun Nambiar 以及 Amazon OpenSearch Service 产品经理 Raj Ramasubbu 详细介绍了他们是如何重新审视该服务以实现这些改进的。作者介绍了两种架构:Classic(经典架构,现有集合将引用该架构)和 NextGen(新一代架构,将作为创建新集合时的默认选项,并受益于这些改进)。

Amazon OpenSearch Serverless 架构

NextGen 架构中新增的共享存储层将计算单元(称为 OpenSearch 容量单元,简称 OCU)与存储解耦。这使得 OCU 成为无状态的。这有两个实际的好处:快速配置和高效缩容。

得益于快速配置,OCU 无需初始化本地磁盘,就可以在数秒钟内开始处理请求。共享存储直接挂载在 OCU 上。

在高效缩容方面,由于数据并不存储在 OCU 中,所以可以释放闲置的容量而不会影响用户数据。

新架构还在 on.aws 域名下引入了两种新的端点格式,二者均采用 AWS PrivateLink,支持创建虚拟私有云(VPC)端点,以便可以从用户的 VPC 或本地基础设施进行内部访问。

每个集合的端点(.aoss..on.aws)工作方式与之前一样,每个端点仅提供对一个集合的访问。

新增的账户级区域端点(.aoss. .on.aws) 则允许用户通过单个主机名访问所有集合;用户可通过 x-amz-aoss-collection-id 或 x-amz-aoss-collection-name 头指定目标集合。该新端点有助于优化网络资源管理,例如使用单一连接池和传输层安全 (TLS) 会话。

在创建和管理新的 NextGen 集合时,2026 年 2 月推出的集合组正发挥着越来越重要的作用。无论是 Classic 还是 NextGen,其版本都仅在组这一级上设定,并适用于该组内创建的所有集合。此外,用户还可以利用集合组在多个集合之间共享计算资源,降低小型工作负载的成本。

用户可以通过控制台、AWS SDK 或 AWS CLI 创建 NextGen 集合。亚马逊云科技表示,对 AWS CloudFormation 的支持也即将推出。

在通过控制台创建时,除了标准方法外,还有一种简化的“快速创建”方法,提供了合理的默认设置。

Amazon OpenSearch Serverless 介于传统搜索平台与新兴的以 AI 为重点的数据存储之间。其最直接的竞争对手是 Elasticsearch Serverless,后者提供了类似的托管搜索和分析功能。对于已经采用 Postgres 的团队而言,支持 pgvector 的 PostgreSQL 提供了一种更简单的数据库中心化方案;而 Pinecone 等专业向量数据库则专注于为 AI 和 RAG 工作负载提供高性能相似度搜索。这些选项体现了搜索功能、运维简便性和 AI 优化之间的不同权衡取舍。

使用 AWS SDK 或 AWS CLI 进行创建时,需要先创建集合组,然后再创建集合,无法享受控制台提供的简化操作体验。

aws opensearchserverless create-collection-group \--name articles-cg \--generation NEXTGEN \--standby-replicas ENABLED \--capacity-limits "minIndexingCapacityInOCU=0,maxIndexCapacityInOCU=4,minSearchCapacityInOCU=4,maxSearchCapacityInOCU=2"aws opensearchserverless create-collection \--name articles-vectors \--type VECTORSEARCH \--collection-group-name articles-cg 

复制代码

在社交媒体平台上,用户对“缩减至零”功能的推出表示欢迎,并指出,该功能曾经是用户在小规模应用场景中使用该服务时的主要痛点之一。

这意义重大,此前我们不得不借助 Algolia 等解决方案才能实现真正的无服务器搜索数据库。

现在,我们也可以开始在小型应用中使用 OpenSearch 了。

也有人警告说,缩减至零会带来一些取舍,例如冷启动,团队必须评估这些因素对应用程序的影响。

[…] 闲置成本更低且多租户支持更佳,但团队仍需针对冷启动和初始化延迟做好规划。

新一代 Amazon OpenSearch Service 已经在所有已经提供 Amazon OpenSearch Serverless 的 AWS 商业区域上线。用户需按 OCU 计费,费用涵盖搜索、索引和 GPU 加速所使用的计算资源。存储费用则按 GB-月单独计费。

原文链接:https://www.infoq.com/news/2026/06/aws-opensearch-serverless/