惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

酷 壳 – CoolShell
酷 壳 – CoolShell
H
Hacker News: Front Page
P
Palo Alto Networks Blog
T
ThreatConnect
Apple Machine Learning Research
Apple Machine Learning Research
博客园_首页
T
True Tiger Recordings
P
Privacy & Cybersecurity Law Blog
B
Blog
IT之家
IT之家
Last Week in AI
Last Week in AI
F
Full Disclosure
Hacker News: Ask HN
Hacker News: Ask HN
C
Comments on: Blog
Microsoft Azure Blog
Microsoft Azure Blog
C
Cybersecurity and Infrastructure Security Agency CISA
Microsoft Security Blog
Microsoft Security Blog
博客园 - 【当耐特】
N
News and Events Feed by Topic
NISL@THU
NISL@THU
腾讯CDC
雷峰网
雷峰网
Security Latest
Security Latest
李成银的技术随笔
M
Microsoft Research Blog - Microsoft Research
L
LangChain Blog
L
Lohrmann on Cybersecurity
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
C
Check Point Blog
Y
Y Combinator Blog
Recent Announcements
Recent Announcements
博客园 - Franky
N
News | PayPal Newsroom
V
V2EX
A
About on SuperTechFans
The Register - Security
The Register - Security
月光博客
月光博客
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
Google Online Security Blog
Google Online Security Blog
MyScale Blog
MyScale Blog
Cisco Talos Blog
Cisco Talos Blog
Vercel News
Vercel News
WordPress大学
WordPress大学
C
Cyber Attacks, Cyber Crime and Cyber Security
The Hacker News
The Hacker News
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
爱范儿
爱范儿
A
Arctic Wolf
L
LINUX DO - 最新话题
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More

博客园 - iTech

SpaceX IPO:史上最大上市案,1.75万亿到2万亿美元的估值到底买了什么? DeepSeek 悄悄挂出 Agent Harness 岗位:Model + Harness = Agent,要做智能体产品了? AI 技术日报 - 2026-05-21 Claw 和 Hermes 精选 10 个零成本 Skills:让 AI Agent 能力翻倍 Stainless:AI 时代最被低估的幕后公司,你用的每个 SDK 可能都出自他们之手 飞书 CLI vs 企业微信 CLI vs 钉钉 CLI:三大办公平台终端工具横评 12-Factor Agents:从 21k Star 的开源项目看 AI Agent 的正确构建姿势 AI 技术日报 - 2026-05-20 Semble:让 AI Agent 搜代码的 Token 消耗直降 98%,怎么做到的 CloakBrowser:15k Star 的隐形浏览器,49 个 C++ 补丁干翻所有反爬检测 AI 技术日报 - 2026-05-19 面向 Agent 的软件开发:当软件的第一用户不再是人类 8MB 内存跑 AI 编程代理?Zerostack 用纯 Rust 证明:Agent 不需要那么重 AI 技术日报 - 2026-05-18 AI 技术日报 - 2026-05-17 AI 技术日报 - 2026-05-16 Anthropic 发布创始人手册:AI Native 公司不是多招几个工程师,是换一种活法 "不用 AI 就会被淘汰"——这是我听过最懒惰的恐吓 0.79ms 创建一个安全沙箱:zeroboot 用 COW 打穿 AI Agent 隔离的性能天花板 2000+ API 一把梭:agentic-ai-apis 让你少写 80% 的基础设施代码 AI 技术日报 - 2026-05-15 OpenHuman:一个让你在几分钟内拥有 AI 超级智能的开源项目 开源项目怎么选 License?个人免费、企业收费的 6 种方案全对比 browser-use vs browser-harness vs agent-browser:AI Agent 浏览器自动化工具终极选型指南 AI 技术日报 - 2026-05-14 一个 Deep Agent 到底能干什么?从功能视角拆解它的全部能力 Deep Agents SDK 功能全清单:我逐行读了源码,整理出这份完整参考手册 7MB 干翻 200MB?开源终端 Terax AI 能不能替代 Warp,我替你试了 Deep Agents vs Claude Code vs Cursor:2026 年 AI 编程 Agent 终极对比 15 个 Deep Agents 实战案例:从 Deep Research 到 Text-to-SQL,看看这个框架能做什么 用 Deep Agents CLI 替代 Claude Code:一条命令装好,任意模型驱动的终端 Agent 拆解 Deep Agents 架构:中间件、后端、Profile 三板斧,这设计比我想的还深 Deep Agents:LangChain 出品的 2026 年最强开源 Agent 框架,3 行代码搞定一切 AI 时代,我辞掉了大厂工作去做独立开发者——血泪换来的 7 条生存法则 中国 AI 六小虎估值大盘点:谁在泡沫上跳舞,谁在价值里扎根 AI 技术日报 - 2026-05-13 写好 AGENTS.md 相当于白嫖一次模型升级(写错了还不如不写) GitHub 49K Star!Ruflo 让 Claude 多 Agent 协作像带团队一样简单 AI 技术日报 - 2026-05-12 罗福莉访谈深度解析:Agent 时代普通人还能干什么 AWS DevOps Agent:亚马逊的自主运维 Agent 来了 Vercel vs Netlify vs Cloudflare Pages:2026 静态托管三巨头实测对比 AI 时代,为什么中国出不了英伟达、三星、海力士? Vercel 开源 Open Agents:把 Claude Code 搬上云,关机也能干活 黄仁勋 CMU 毕业演讲全文解读:计算范式 60 年来首次被重写,每个人都是程序员 AI 技术日报 - 2026-05-11 nuwa-skill 18K Star:16 个思维 Skill 全拆解 - iTech Hermes Web UI:把 AI Agent 装进浏览器,一个面板管到底 AI Agent 工具多到选不过来?Agent MGMT 帮你一次性看清全局 营收创新高却裁员 20%:Cloudflare 用 AI Agent 告诉我们,替代已经开始了 AI 技术日报 - 2026-05-10 23K Star 的 DeepSeek TUI,真能代替 Claude Code 吗? Gumroad创始人把《极简创业》做成AI技能包:10个斜杠命令,让Claude当你的创业顾问 Open Design:3.4万星的开源AI设计工作室,让你的编程Agent秒变设计师 免费搭一个 AI 新闻雷达:Horizon 开源项目部署实战 Cloudflare Agent Setup:一行指令让 AI Agent 帮你配好整个开发环境 AI 技术日报 - 2026-05-09 AI Agent 写完代码谁来测?这个开源沙箱把 CI/CD 和多 Agent 协作全包了 7万星的AI交易框架:让大模型模拟投行多空辩论,自动做交易决策 71000颗星的AI交易团队:让大模型模拟投行分工,自动做交易决策 13400颗星的开源项目:输入一句话,AI全自动帮你做短视频 102颗星的沙盒:当AI学会自己写代码、跑测试、做部署 AI 技术日报 - 2026-05-08 29k 星的 PageIndex:不用向量数据库,靠推理就能做 RAG 每天花两小时刷信息?这个开源项目帮你全自动搞定 读源码像读小说?试了 DeepWiki 和 Zread,我再也不想裸读 GitHub 了 Matt Pocock 开源的这套 .claude 技能,为什么让工程师集体上头? Cursor Team Kit:Cursor 官方团队在用的 17 个 AI 工作流 AI 技术日报 - 2026-05-07 AI 技术日报 - 2026-05-06 - iTech AI 技术日报 - 2026-05-05 Anthropic CEO 说 12 个月内程序员要失业,我扒完他的底牌,发现事情没那么简单 把工程师的肌肉记忆装进 Claude Code,这个 4300 Star 的项目我后悔没早用 AI 技术日报 - 2026-05-04 AI 技术日报 - 2026-05-03 AI 技术日报 - 2026-05-02 六大 Agent 框架横评:谁支持 Skills?谁能自动创建 Agent?MCP 呢? Wechatsync:一个 Chrome 插件,一键把文章同步到 31 个平台 LangChain 开源了 Open SWE:Stripe、Ramp、Coinbase 内部都在造的编程 Agent Cockpit:把 Claude Code 从终端里搬出来,装进浏览器 Cursor 把自家的 AI Agent 开放了:写几行 TypeScript 就能调 Cursor 干活 AI 技术日报 - 2026-05-01 AI 写代码每次结果都不一样?Archon 用 YAML 工作流把 AI 编程变成流水线 AI 写代码比你快了,但你还是得学编程——只不过学法得换 腾讯的龙虾特工队:4 个 AI Agent 同日更新,全家桶正式成型 Agno 不做更聪明的 Agent,它要把所有 Agent 框架包进同一个操作系统 Hermes Agent 终于有了像样的 Web 界面,而且还支持远程访问 Datawhale 出了一套 29 学科知识地图,把 AI 的底牌全掀了 Hermes Agent 在聊天框里就能用的 20 种高级功能 一份 AGENTS.md 能顶一次模型升级?Augment Code 用数据说了算 NVIDIA 开源了一个「AI 沙箱」,20K Star,让 Agent 跑代码不再裸奔 60ms 冷启动、5MB 内存:腾讯开源的这个沙箱让 Docker 安全隔离像笑话 AI 技术日报 - 2026-04-30 AI 技术日报 - 2026-04-29 AI 技术日报 - 2026-04-28 Goose:Linux 基金会亲儿子,能撼动 Claude Code 和 OpenCode 吗? AI 技术日报 - 2026-04-27 AI 技术日报 - 2026-04-26 Google 把价值20美元/月的东西免费了,102K人已经抢到了 OpenClaw 和 Claude Code 网络搜索配置指南
OpenAI 官方 Agent SDK 来了:22k Star,支持 100+ 模型,Python 10 行代码上手
iTech · 2026-04-19 · via 博客园 - iTech

OpenAI 官方 Agent SDK 来了:22k Star,支持 100+ 模型,Python 10 行代码上手

等了一年多,OpenAI 终于给出了官方的 Agent 答案——不是 Swam 那个实验品,是一个正经的、生产级的 SDK。openai-agents-python,22k Star,MIT 协议,v0.14.2,迭代速度很快(最近一个月发了 5 个版本)。

最让我意外的是:它不绑定 OpenAI 自己的模型,支持 100+ LLM。这不像 OpenAI 的风格。

本文提纲

  1. 这个 SDK 到底是什么
  2. 核心概念:Agent、Handoff、Guardrail
  3. Sandbox Agent:能操作文件系统的新物种
  4. 跟 LangChain、CrewAI 有什么不同
  5. 10 行代码跑起来
  6. 值不值得用

这个 SDK 到底是什么

一句话:OpenAI 官方出的轻量级 Multi-Agent 框架。

它解决的问题是——怎么用 Python 把多个 LLM Agent 串起来协同工作。跟 LangChain 那种"什么都包"的思路不同,OpenAI Agents SDK 只做几件事,但做得干净:

  • Agent 定义:指令 + 工具 + Handoff + Guardrail
  • Agent 协作:Handoff(交接)和 Agent-as-Tool(Agent 当工具用)
  • 安全护栏:输入/输出 Guardrail,支持 LLM 做判断
  • Human-in-the-loop:内置的人机交互机制
  • Tracing:内置追踪和调试 UI
  • Realtime Agent:支持 gpt-realtime-1.5 做语音 Agent
  • Sandbox Agent:v0.14.0 新增,Agent 可以操作文件系统和容器

安装就一行:

pip install openai-agents

语音支持加个 voice 分组,Redis Session 支持加个 redis 分组。

核心概念:Agent、Handoff、Guardrail

Agent:一切的基础

一个 Agent 就是 LLM + 指令 + 工具的组合:

from agents import Agent, Runner

agent = Agent(
    name="Assistant",
    instructions="You only respond in haikus.",
)

result = await Runner.run(agent, "Tell me about recursion in programming.")
print(result.final_output)
# Function calls itself,
# Looping in smaller pieces,
# Endless by design.

就这么简单。Runner.run() 是异步的,也有同步版本 Runner.run_sync()

Handoff:Agent 之间怎么交接

Handoff 是 Multi-Agent 的核心机制——一个 Agent 觉得自己搞不定,把任务转给另一个更合适的 Agent:

from agents import Agent, Runner

spanish_agent = Agent(
    name="spanish_agent",
    instructions="You translate the user's message to Spanish",
    handoff_description="An english to spanish translator",
)

french_agent = Agent(
    name="french_agent",
    instructions="You translate the user's message to French",
    handoff_description="An english to french translator",
)

orchestrator = Agent(
    name="orchestrator",
    instructions="You are a translation agent. You use the tools given to you to translate.",
    tools=[
        spanish_agent.as_tool(tool_name="translate_to_spanish", tool_description="..."),
        french_agent.as_tool(tool_name="translate_to_french", tool_description="..."),
    ],
)

这里有两种模式:
- Handoff:Agent A 把控制权完全交给 Agent B
- Agent-as-Tool:Agent A 调用 Agent B 当工具用,拿到结果后继续自己的流程

两种模式适用不同场景。Handoff 适合"接力赛",Agent-as-Tool 适合"指挥官模式"。

Guardrail:安全护栏

Guardrail 是跑在 Agent 执行旁边的并行检查,不阻塞主流程,但可以中断执行:

from pydantic import BaseModel
from agents import Agent, GuardrailFunctionOutput, input_guardrail

class MathHomeworkOutput(BaseModel):
    reasoning: str
    is_math_homework: bool

guardrail_agent = Agent(
    name="Guardrail check",
    instructions="Check if the user is asking you to do their math homework.",
    output_type=MathHomeworkOutput,
)

@input_guardrail
async def math_guardrail(context, agent, input):
    result = await Runner.run(guardrail_agent, input, context=context.context)
    final = result.final_output_as(MathHomeworkOutput)
    return GuardrailFunctionOutput(
        output_info=final,
        tripwire_triggered=final.is_math_homework,
    )

用 Pydantic Model 定义输出结构,用 LLM 做判断,tripwire_triggered=True 就会中断 Agent 执行。输入和输出都可以加 Guardrail。

Sandbox Agent:能操作文件系统的新物种

v0.14.0 新增的 Sandbox Agent 是这个 SDK 最大的亮点之一。普通 Agent 只能调用 API 和函数,Sandbox Agent 可以操作真实的文件系统:

from agents import Runner
from agents.run import RunConfig
from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
from agents.sandbox.entries import GitRepo
from agents.sandbox.sandboxes import UnixLocalSandboxClient

agent = SandboxAgent(
    name="Workspace Assistant",
    instructions="Inspect the sandbox workspace before answering.",
    default_manifest=Manifest(
        entries={
            "repo": GitRepo(repo="openai/openai-agents-python", ref="main"),
        }
    ),
)

result = Runner.run_sync(
    agent,
    "Inspect the repo README and summarize what this project does.",
    run_config=RunConfig(sandbox=SandboxRunConfig(client=UnixLocalSandboxClient())),
)
print(result.final_output)

这个 Agent 能:
- 克隆 Git 仓库到沙箱
- 读取和检查文件
- 运行命令
- 应用 patch
- 在长时间任务中保持工作区状态

本质上就是一个有文件系统和执行环境的 Agent,跟 Claude Code 的能力很像。

跟 LangChain、CrewAI 有什么不同

我列个表:

特性 OpenAI Agents SDK LangChain/LangGraph CrewAI
定位 轻量 Agent 框架 全栈 LLM 框架 Multi-Agent 编排
学习曲线 低,概念少 高,概念非常多 中等
模型支持 100+ LLM(via any-llm/LiteLLM) 100+ LLM OpenAI + 部分
核心抽象 Agent + Handoff Chain/Graph/Tool Crew + Task + Agent
Sandbox 内置
Realtime/Voice 内置 需额外集成
Guardrail 内置 需自己实现
Tracing 内置 LangSmith(付费)
代码量 10 行 Hello World 30+ 行 Hello World 20+ 行
许可证 MIT MIT MIT

几个关键区别:

1. 概念极简

OpenAI Agents SDK 的核心概念只有 Agent、Runner、Handoff、Guardrail、Tool 五个。LangChain 光是 Chain 就有 LLMChain、SequentialChain、RouterChain……学完文档就累了。

2. 不绑定 OpenAI

这一点最出乎意料。SDK 底层使用 any-llm 和 LiteLLM,支持 OpenAI Responses API、Chat Completions API,以及其他 100+ 模型。用 Claude、Gemini、DeepSeek 都行。

3. Sandbox Agent 是杀手级功能

能操作文件系统和容器的 Agent,目前其他框架都没有开箱即用的支持。这让 Agent 从"只能调 API"进化到了"能做实际工作"。

4. Tracing 免费

LangChain 的 LangSmith 追踪要付费。OpenAI Agents SDK 内置 Tracing,开箱即用,不收钱。

10 行代码跑起来

最快的上手方式:

# 安装
pip install openai-agents

# 设置 API Key(支持任何 OpenAI 兼容的 Key)
export OPENAI_API_KEY=sk-...
import asyncio
from agents import Agent, Runner

async def main():
    agent = Agent(name="Assistant", instructions="You only respond in haikus.")
    result = await Runner.run(agent, "Tell me about recursion in programming.")
    print(result.final_output)

asyncio.run(main())

跑起来。官方 examples 目录有 15+ 场景的完整示例,从 basic 到 customer_service 到 financial_research_agent,拿来就能改。

值不值得用

适合用的场景:

  • 需要快速搭建 Multi-Agent 原型,不想学 LangGraph 那套复杂概念
  • 需要 Sandbox 能力(文件操作、命令执行)
  • 需要 Voice/Realtime Agent
  • 团队用 Python,追求简单直接

不太适合的场景:

  • 需要非常复杂的 DAG 编排(LangGraph 更灵活)
  • 需要 RAG pipeline(LangChain 的文档加载器更丰富)
  • 已有 LangChain 生态的大量代码,迁移成本高

我的判断:如果你是刚开始做 Agent 开发,OpenAI Agents SDK 是目前最好的起点。概念少、代码干净、文档清晰,而且有 OpenAI 团队持续维护。22k Star 说明社区也认可。

项目地址:github.com/openai/openai-agents-python

文档:openai.github.io/openai-agents-python


作者: itech001
来源: 公众号:AI人工智能时代
主页: https://www.theaiera.cn,每日分享最前沿的AI新闻和技术。

本文首发于 AI人工智能时代,转载请注明出处。