惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

量子位
S
Securelist
MyScale Blog
MyScale Blog
Jina AI
Jina AI
罗磊的独立博客
The Cloudflare Blog
美团技术团队
博客园 - 叶小钗
阮一峰的网络日志
阮一峰的网络日志
博客园 - 三生石上(FineUI控件)
月光博客
月光博客
雷峰网
雷峰网
小众软件
小众软件
aimingoo的专栏
aimingoo的专栏
大猫的无限游戏
大猫的无限游戏
博客园 - Franky
博客园 - 聂微东
Y
Y Combinator Blog
酷 壳 – CoolShell
酷 壳 – CoolShell
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
MongoDB | Blog
MongoDB | Blog
T
Tailwind CSS Blog
Attack and Defense Labs
Attack and Defense Labs
博客园_首页
Latest news
Latest news
Apple Machine Learning Research
Apple Machine Learning Research
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
The Hacker News
The Hacker News
G
GRAHAM CLULEY
Simon Willison's Weblog
Simon Willison's Weblog
Exploit-DB.com RSS Feed
Exploit-DB.com RSS Feed
P
Proofpoint News Feed
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
U
Unit 42
D
Docker
Webroot Blog
Webroot Blog
N
Netflix TechBlog - Medium
T
Tor Project blog
C
Cyber Attacks, Cyber Crime and Cyber Security
L
LINUX DO - 最新话题
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
The Last Watchdog
The Last Watchdog
B
Blog
Recent Announcements
Recent Announcements
GbyAI
GbyAI
Microsoft Azure Blog
Microsoft Azure Blog
Security Latest
Security Latest
V2EX - 技术
V2EX - 技术
N
News | PayPal Newsroom
Microsoft Security Blog
Microsoft Security Blog

迷途小书童的Note

微软开源了一个帮 Agent 打磨技能的工具,思路很野 - 迷途小书童的Note X上如何下载视频? - 迷途小书童的Note 装完Hermes之后,我被这5个东西救了 - 迷途小书童的Note 从此写代码,只需要在旁边看着 小模型大野心 跑大模型,最贵的不是 GPU,是这个东西 vLLM的Rust前端PR了,预处理吞吐量直接翻了5倍! 大模型跑在端侧,到底有多难?我们踩过的那些坑 AI 生成的前端界面,为什么总是不够好看? 阿里通义VimRAG:让AI同时”读文档、看图片、看视频” 一个让你像聊天一样做PPT的AI工具 上下文工程:会话与记忆 颠覆视频创作!一键替换3D角色,你还不来试试? AI证件照,一键搞定! 26.2k,收下这个FastAPI全栈模板! Star马上破万,这款AI知识库你一定要看看! 超级Prompt! 不懂编程也没关系,Cursor AI帮你轻松写代码! U2-Net:图像分割中的背景移除技术
推理能力超博士,OpenAI发布最强模型o1
2024-09-14 · via 迷途小书童的Note
    欢迎访问我的网站,希望内容对您有用,关注公众号后台领取免费AI学习资料。

昨天凌晨,OpenAI又给我们带来了一个激动人心的消息,他们发布了一款全新的AI模型o1,该模型在性能上远超以往的GPT系列。

告别GPT,开启新纪元

OpenAI选择将新模型命名为”o1″,而不是继续使用GPT系列的名称。”o1″代表了一个全新的起点和范式。它不再局限于语言生成,而是在推理能力方面取得了重大突破。简单来说,如果说GPT系列像是一个能说会道的学生,那么o1就更像是一个深思熟虑的哲学家。

惊人的性能提升

那么,o1到底有多厉害呢?让我们来看看一些具体的数据:

  • 在国际数学奥林匹克竞赛(IMO)的资格考试中,GPT-4只解决了13%的问题,而o1模型竟然解决了83%的问题!这简直就是从”及格边缘”一跃成为”班级前三”啊!
  • 在编程方面,o1在Codeforces比赛中的表现超过了89%的选手。这意味着,它已经能够与大多数专业程序员一较高下了。
  • 更令人震惊的是,在博士级科学问题(GPQA Diamond)上,o1达到了78%的正确率,远超GPT-4的56.1%,甚至超过了人类专家的69.7%!

推理能力超博士,OpenAI发布最强模型o1

这些数据无不显示,o1在解决复杂问题和进行深度推理方面,已经达到甚至超越了人类专家的水平。

思考方式的革命

o1最与众不同的特点,就是它的”思考”方式。与早期版本不同,o1模型在作出回答之前会像人类一样”深思熟虑”,用时约10-20秒,产生一个长长的内部思路链,并能够尝试不同的策略并识别自身的错误。

这让我想到了著名心理学家丹尼尔·卡尼曼在《思考,快与慢》中提出的理论。他认为人类的思维有两个系统:系统1是快速、直觉性的;系统2则是慢速、理性的。如果用这个理论来类比,我们可以说GPT系列更像是系统1,而o1则更接近系统2。

使用o1的最佳实践

根据OpenAI的建议,使用o1时应该:

  • 保持提示简单直接,无需复杂的指导。
  • 避免使用思路链提示,因为o1会自动进行内部推理。
  • 使用分隔符来提高输入的清晰度。
  • 在使用检索增强生成(RAG)时,仅提供最相关的信息。

这些建议体现了o1的高度智能和自主推理能力,使用起来将会更加简单直接。

o1的局限性

尽管o1表现出色,但它也有一些局限性:

  • 速度较慢:由于需要进行深度思考,o1的响应时间比GPT系列长。
  • 使用成本高:目前o1的使用费用相当昂贵,即使开通了每月20美元的会员,使用次数也有严格限制。
  • 世界知识可能有限:特别是o1-mini版本,虽然推理能力强,但在广泛的世界知识方面可能不如完整版本。

对未来的思考

o1的出现无疑是AI领域的一个重要里程碑。它不仅展示了AI在逻辑推理和问题解决方面的巨大进步,更预示着AI可能在更多领域超越人类专家水平。

好了,今天的分享就到这里,我们下期见。

您必须 登录 才能发表评论!