惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

W
WeLiveSecurity
The GitHub Blog
The GitHub Blog
Engineering at Meta
Engineering at Meta
Microsoft Azure Blog
Microsoft Azure Blog
The Register - Security
The Register - Security
Stack Overflow Blog
Stack Overflow Blog
博客园 - 三生石上(FineUI控件)
T
Threat Research - Cisco Blogs
S
SegmentFault 最新的问题
V2EX - 技术
V2EX - 技术
Hacker News: Ask HN
Hacker News: Ask HN
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
P
Proofpoint News Feed
J
Java Code Geeks
Microsoft Security Blog
Microsoft Security Blog
M
MIT News - Artificial intelligence
AI
AI
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
P
Proofpoint News Feed
Hacker News - Newest:
Hacker News - Newest: "LLM"
B
Blog
N
News and Events Feed by Topic
N
News | PayPal Newsroom
Google DeepMind News
Google DeepMind News
酷 壳 – CoolShell
酷 壳 – CoolShell
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
WordPress大学
WordPress大学
C
Cybersecurity and Infrastructure Security Agency CISA
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
博客园 - 【当耐特】
U
Unit 42
腾讯CDC
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
The Cloudflare Blog
H
Help Net Security
Recent Announcements
Recent Announcements
P
Privacy & Cybersecurity Law Blog
IT之家
IT之家
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
Security Archives - TechRepublic
Security Archives - TechRepublic
L
LINUX DO - 热门话题
Martin Fowler
Martin Fowler
MongoDB | Blog
MongoDB | Blog
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
H
Heimdal Security Blog
博客园 - 聂微东
S
Securelist
大猫的无限游戏
大猫的无限游戏
Cloudbric
Cloudbric
Cisco Talos Blog
Cisco Talos Blog

Bryan

人生第一次离职,感觉应该写点什么 其实我有点理解 HodlAI 的限制 - V2EX 在 V2 的主题收藏破千了,简单让 AI 分析了下
记录下我感觉的 AI 模型的几个「里程碑」 - V2EX
SingeeKing · 2026-02-13 · via Bryan

纯个人感受,十分主观

gpt-3.5/4:不用多说,开启了 LLM 的时代

gpt-4o:真正的统一多模态(好像也是至今唯一真正做到文字、语音、图片合一的? OpenAI 的新模型不是、其它厂商好像也没有)

o1/o3 & DeepResearch:开启了模型思考的时代

Claude Sonnet 3.7 & Claude Code:开启了 AI 编程的时代

Claude Opus 4:我个人感觉 AI 可以开始写程序了(之前的模型虽然也能写,但是效果实在一言难尽,这个版本我感觉是对我而言第一个我可以真的开始日常用 AI 写程序的模型)

gpt-5.2:我感觉终于可以依赖 AI 写代码了(我不再需要逐行审阅 AI 写的代码,而是可以默认信任它、只需要做整体架构、找 bug )


还有几个值得一说的

  1. o1 开始,模型可以在思考时调用工具;而其他家支持思考时调用工具似乎晚了很久
  2. Claude Code 的 Plan 模式完全模拟了日常「先调研、再开发」的思路,也算是开创了一个先河
  3. 虽然我现在日常用的 gpt-5.3-codex ,但我并没有觉得它相比 gpt-5.2 有多好,更多的还是提升了速度;而且细节上我感觉 gpt-5.2-codex 和 gpt-5.3-codex 都没有 gpt-5.2 处理的好,所以对于某些复杂的模块我还是会让 gpt-5.2 做一次 Code Review
  4. 昨晚刚发布的 gpt-5.3-codex-spark ,怎么说呢,我感觉更像是 gpt-5.1-codex-mini 的升级版(效果 & 速度的双重提升),实际效果目前我并没有觉得有多好,我也仅仅是测试了下、仍然在继续用 gpt-5.3-codex (不过官方说了 spark 是独立速率限制,所以或许等我这周用量用完了会去再着重用用它;这个模型发展起来,感觉搭配效果最好的模型做 plan 、它做实现应该会好些
  5. 作为 Google AI Pro 会员,Gemini 的各种模型我也都给过机会,我对它的评价就是 —— 除了便宜一无是处
  6. 作为 Cursor 用户,composer-1 我也试了,一开始真的感觉很惊艳,我的感觉是「速度足够快,完全可以做到同步编程,快速发现问题修改问题,其实效率也不低」但现在觉得我可以忍受异步编程(毕竟可以人工 concurrent —— 利用 worktree 同时跑多个任务);至于新的 composer-1.5 还没来得及试,因为我已经不太想要做一名人肉测试帮模型找 bug 了
  7. 我个人没有使用过任何国产模型,所以不做任何相关评价