惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

WordPress大学
WordPress大学
阮一峰的网络日志
阮一峰的网络日志
J
Java Code Geeks
宝玉的分享
宝玉的分享
C
CXSECURITY Database RSS Feed - CXSecurity.com
P
Privacy International News Feed
The Register - Security
The Register - Security
T
Threat Research - Cisco Blogs
Recent Commits to openclaw:main
Recent Commits to openclaw:main
PCI Perspectives
PCI Perspectives
Hugging Face - Blog
Hugging Face - Blog
T
Tailwind CSS Blog
酷 壳 – CoolShell
酷 壳 – CoolShell
N
News | PayPal Newsroom
Google Online Security Blog
Google Online Security Blog
aimingoo的专栏
aimingoo的专栏
F
Full Disclosure
P
Palo Alto Networks Blog
A
About on SuperTechFans
Microsoft Azure Blog
Microsoft Azure Blog
F
Fortinet All Blogs
爱范儿
爱范儿
Recorded Future
Recorded Future
月光博客
月光博客
T
True Tiger Recordings
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
T
Tenable Blog
L
Lohrmann on Cybersecurity
博客园 - 聂微东
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
大猫的无限游戏
大猫的无限游戏
S
Security @ Cisco Blogs
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
L
LINUX DO - 热门话题
Hacker News: Ask HN
Hacker News: Ask HN
C
Check Point Blog
H
Hackread – Cybersecurity News, Data Breaches, AI and More
L
LangChain Blog
The Cloudflare Blog
Malwarebytes
Malwarebytes
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
I
InfoQ
N
Netflix TechBlog - Medium
Recent Announcements
Recent Announcements
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
SecWiki News
SecWiki News
云风的 BLOG
云风的 BLOG
T
ThreatConnect
博客园 - 叶小钗
B
Blog

博客园 - iTech

Claude Code 为什么放弃 RAG 用 Grep 搜索代码?大型代码库最佳实践全解析 - iTech Superset (YC P26):Agent 时代的全新 IDE,同时跑 10 个 Claude Code 互不干扰 - iTech AI 技术日报 - 2026-05-23 3.5 个月 4.3 万 Star:nanobot 凭什么成为最火的开源 AI Agent CodeGraph:给 AI 编程助手装上代码知识图谱,省 35% 费用、减少 70% 工具调用 AI Engineering from Scratch:435 节课从线性代数到自主 Agent,每个算法手写一遍 Lucarne:不用盯着电脑也能掌控 AI Agent,微信/Telegram 远程遥控本地编码助手 财富正在向 AI 集中:三个万亿级 IPO 同场竞技,一场前所未有的造富运动 程序员必备核心技能手册:从 Linux 到 Docker 的实战速查 Deep:DeepSeek 版的 Aider / Claude Code,开源 CLI 编程工具新选择 AI 技术日报 - 2026-05-22 PUA vs NoPUA:用恐惧还是用爱驱动 AI Agent?一场 17000 Star 的路线之争 Anthropic 停招 L6 以下:当最强 AI 公司自己都不招初级工程师了 CLI for Microsoft 365 实战:用命令行操控 Teams 收发消息 面试 AI Agent 工程师会被问什么?40+ 真题 + 知识图谱全梳理 7 个标准正在重塑 AI 开发:从 MCP 到 AG-UI,一文看懂 Agent 时代的协议栈 SpaceX IPO:史上最大上市案,1.75万亿到2万亿美元的估值到底买了什么? DeepSeek 悄悄挂出 Agent Harness 岗位:Model + Harness = Agent,要做智能体产品了? AI 技术日报 - 2026-05-21 Claw 和 Hermes 精选 10 个零成本 Skills:让 AI Agent 能力翻倍 Stainless:AI 时代最被低估的幕后公司,你用的每个 SDK 可能都出自他们之手 飞书 CLI vs 企业微信 CLI vs 钉钉 CLI:三大办公平台终端工具横评 12-Factor Agents:从 21k Star 的开源项目看 AI Agent 的正确构建姿势 AI 技术日报 - 2026-05-20 Semble:让 AI Agent 搜代码的 Token 消耗直降 98%,怎么做到的 CloakBrowser:15k Star 的隐形浏览器,49 个 C++ 补丁干翻所有反爬检测 AI 技术日报 - 2026-05-19 面向 Agent 的软件开发:当软件的第一用户不再是人类 8MB 内存跑 AI 编程代理?Zerostack 用纯 Rust 证明:Agent 不需要那么重 AI 技术日报 - 2026-05-18 AI 技术日报 - 2026-05-17 AI 技术日报 - 2026-05-16 Anthropic 发布创始人手册:AI Native 公司不是多招几个工程师,是换一种活法 "不用 AI 就会被淘汰"——这是我听过最懒惰的恐吓 0.79ms 创建一个安全沙箱:zeroboot 用 COW 打穿 AI Agent 隔离的性能天花板 2000+ API 一把梭:agentic-ai-apis 让你少写 80% 的基础设施代码 AI 技术日报 - 2026-05-15 OpenHuman:一个让你在几分钟内拥有 AI 超级智能的开源项目 开源项目怎么选 License?个人免费、企业收费的 6 种方案全对比 browser-use vs browser-harness vs agent-browser:AI Agent 浏览器自动化工具终极选型指南 AI 技术日报 - 2026-05-14 一个 Deep Agent 到底能干什么?从功能视角拆解它的全部能力 Deep Agents SDK 功能全清单:我逐行读了源码,整理出这份完整参考手册 7MB 干翻 200MB?开源终端 Terax AI 能不能替代 Warp,我替你试了 Deep Agents vs Claude Code vs Cursor:2026 年 AI 编程 Agent 终极对比 15 个 Deep Agents 实战案例:从 Deep Research 到 Text-to-SQL,看看这个框架能做什么 用 Deep Agents CLI 替代 Claude Code:一条命令装好,任意模型驱动的终端 Agent 拆解 Deep Agents 架构:中间件、后端、Profile 三板斧,这设计比我想的还深 Deep Agents:LangChain 出品的 2026 年最强开源 Agent 框架,3 行代码搞定一切 AI 时代,我辞掉了大厂工作去做独立开发者——血泪换来的 7 条生存法则 中国 AI 六小虎估值大盘点:谁在泡沫上跳舞,谁在价值里扎根 AI 技术日报 - 2026-05-13 写好 AGENTS.md 相当于白嫖一次模型升级(写错了还不如不写) GitHub 49K Star!Ruflo 让 Claude 多 Agent 协作像带团队一样简单 AI 技术日报 - 2026-05-12 罗福莉访谈深度解析:Agent 时代普通人还能干什么 AWS DevOps Agent:亚马逊的自主运维 Agent 来了 Vercel vs Netlify vs Cloudflare Pages:2026 静态托管三巨头实测对比 AI 时代,为什么中国出不了英伟达、三星、海力士? Vercel 开源 Open Agents:把 Claude Code 搬上云,关机也能干活 黄仁勋 CMU 毕业演讲全文解读:计算范式 60 年来首次被重写,每个人都是程序员 AI 技术日报 - 2026-05-11 nuwa-skill 18K Star:16 个思维 Skill 全拆解 - iTech Hermes Web UI:把 AI Agent 装进浏览器,一个面板管到底 AI Agent 工具多到选不过来?Agent MGMT 帮你一次性看清全局 营收创新高却裁员 20%:Cloudflare 用 AI Agent 告诉我们,替代已经开始了 AI 技术日报 - 2026-05-10 23K Star 的 DeepSeek TUI,真能代替 Claude Code 吗? Gumroad创始人把《极简创业》做成AI技能包:10个斜杠命令,让Claude当你的创业顾问 Open Design:3.4万星的开源AI设计工作室,让你的编程Agent秒变设计师 免费搭一个 AI 新闻雷达:Horizon 开源项目部署实战 Cloudflare Agent Setup:一行指令让 AI Agent 帮你配好整个开发环境 AI 技术日报 - 2026-05-09 AI Agent 写完代码谁来测?这个开源沙箱把 CI/CD 和多 Agent 协作全包了 7万星的AI交易框架:让大模型模拟投行多空辩论,自动做交易决策 71000颗星的AI交易团队:让大模型模拟投行分工,自动做交易决策 13400颗星的开源项目:输入一句话,AI全自动帮你做短视频 102颗星的沙盒:当AI学会自己写代码、跑测试、做部署 AI 技术日报 - 2026-05-08 29k 星的 PageIndex:不用向量数据库,靠推理就能做 RAG 每天花两小时刷信息?这个开源项目帮你全自动搞定 读源码像读小说?试了 DeepWiki 和 Zread,我再也不想裸读 GitHub 了 Matt Pocock 开源的这套 .claude 技能,为什么让工程师集体上头? Cursor Team Kit:Cursor 官方团队在用的 17 个 AI 工作流 AI 技术日报 - 2026-05-07 AI 技术日报 - 2026-05-06 - iTech AI 技术日报 - 2026-05-05 Anthropic CEO 说 12 个月内程序员要失业,我扒完他的底牌,发现事情没那么简单 把工程师的肌肉记忆装进 Claude Code,这个 4300 Star 的项目我后悔没早用 AI 技术日报 - 2026-05-04 AI 技术日报 - 2026-05-03 AI 技术日报 - 2026-05-02 六大 Agent 框架横评:谁支持 Skills?谁能自动创建 Agent?MCP 呢? Wechatsync:一个 Chrome 插件,一键把文章同步到 31 个平台 LangChain 开源了 Open SWE:Stripe、Ramp、Coinbase 内部都在造的编程 Agent Cockpit:把 Claude Code 从终端里搬出来,装进浏览器 Cursor 把自家的 AI Agent 开放了:写几行 TypeScript 就能调 Cursor 干活 AI 技术日报 - 2026-05-01 AI 写代码每次结果都不一样?Archon 用 YAML 工作流把 AI 编程变成流水线 AI 写代码比你快了,但你还是得学编程——只不过学法得换
Models.dev:查 AI 模型价格不用再开十几个网页了,4,844 个模型一站式对比
iTech · 2026-05-23 · via 博客园 - iTech

选模型的时候,你得开 OpenAI 定价页、Anthropic 定价页、Google 定价页、DeepSeek 定价页……每个页面排版不一样,单位不统一(有的是 1K token,有的是 1M token),还有的藏在文档深处。

Models.dev 把这件事标准化了。一个开源数据库,收录 130+ 厂商、4,844 个 AI 模型的规格、定价和能力,全部用统一格式存储,一行 API 调用就能查询。由 SST 团队维护,也是 OpenCode 内部使用的模型数据库。

这篇文章涵盖什么

  • Models.dev 是什么、解决什么问题
  • 怎么用(API + 网站 + 直接集成)
  • 当前各厂商旗舰模型最新定价和能力对比
  • 数据结构和贡献方式

一行命令查询所有模型

curl https://models.dev/api.json

返回 JSON 格式的完整模型数据库。每个模型包含:

  • 定价:输入/输出/推理/缓存读/缓存写 token 单价(统一为每百万 token 美元)
  • 能力:推理(reasoning)、工具调用、结构化输出、文件附件
  • 限制:上下文窗口、最大输入、最大输出
  • 模态:支持的输入/输出格式(文本、图片、音频、视频、PDF)
  • 元数据:知识截止日期、发布日期、最后更新日期、是否开源权重

网站 models.dev 提供可视化浏览和对比界面。

当前各厂商旗舰模型价格一览

数据来自 Models.dev API(2026 年 5 月 23 日),以下是各厂商最新旗舰模型对比:

第一梯队:顶级推理模型

模型 厂商 输入价 输出价 缓存读 上下文 推理 工具 模态
GPT-5.5 Pro OpenAI $30 $180 1050k 文+图+PDF
Claude Opus 4.7 Anthropic $5 $25 $0.5 1000k 文+图+PDF
Gemini 3.5 Flash Google $1.5 $9 $0.15 1048k 文+图+音+视频+PDF
Grok 4.3 xAI $1.25 $2.5 $0.2 1000k 文+图+PDF
DeepSeek V4 Pro DeepSeek $1.74 $3.48 $0.145 1000k 文本
Qwen3.7 Max 阿里 $2.5 $7.5 $0.5 1000k 文本

中端主力模型

模型 厂商 输入价 输出价 上下文 推理 工具 模态
Claude Sonnet 4.6 Anthropic $3 $15 1000k 文+图+PDF
GPT-5.5 OpenAI $5 $30 1050k 文+图+PDF
Mistral Medium 3.5 Mistral $1.5 $7.5 262k 文+图
Grok Build 0.1 xAI $1 $2 256k 文+图+PDF
Qwen3.6 Flash 阿里 $0.19 $1.13 1000k 文+图+视频

性价比之选

模型 厂商 输入价 输出价 上下文 推理 工具 开源
DeepSeek V4 Flash DeepSeek $0.14 $0.28 1000k
Gemma 4 26B Google 免费 免费 262k
GPT-5.4 nano OpenAI $0.2 $1.25 400k
Mistral Small Mistral $0.15 $0.6 256k
GPT-5.4 mini OpenAI $0.75 $4.5 400k
DeepSeek Chat DeepSeek $0.14 $0.28 1000k

几个值得注意的趋势:

  • 百万 token 上下文已成为标配:Claude、GPT、Gemini、DeepSeek、Qwen 旗舰模型全部支持 1000k+ 上下文
  • 推理能力(Reasoning)全面标配:几乎所有中端以上模型都支持 chain-of-thought 推理
  • DeepSeek V4 Flash 性价比碾压:$0.14/$0.28 的价格 + 1000k 上下文 + 推理能力 + 开源权重
  • Grok 4.3 价格激进:$1.25/$2.5,在旗舰模型中属于最低档位
  • Gemini 3.5 Flash 模态最全:文本+图片+音频+视频+PDF 全支持

怎么用

1. 直接访问网站

打开 models.dev,按厂商、模型名搜索,直接对比定价和能力。

2. API 查询

curl https://models.dev/api.json

返回结构化 JSON,可以直接在应用中解析使用。Model ID 字段与 AI SDK 的标识符一致。

curl https://models.dev/logos/anthropic.svg
curl https://models.dev/logos/openai.svg

4. 在 OpenCode 中使用

Models.dev 是 OpenCode 的内置模型数据库。配置本地模型路径即可使用自定义数据:

OPENCODE_MODELS_PATH="dist/_api.json" opencode

数据结构

数据以 TOML 文件存储在 GitHub 仓库中,按厂商和模型组织:

providers/
├── anthropic/
│   ├── provider.toml          # 厂商信息
│   ├── logo.svg               # Logo
│   └── models/
│       ├── claude-opus-4-7.toml
│       ├── claude-sonnet-4-6.toml
│       └── claude-haiku-4-5.toml
├── openai/
│   ├── provider.toml
│   └── models/
│       ├── gpt-5-5.toml
│       └── ...
└── google/
    ├── provider.toml
    └── models/
        ├── gemini-3-5-flash.toml
        └── ...

每个模型文件包含完整信息:

name = "Claude Opus 4.7"
attachment = true
reasoning = true
tool_call = true
structured_output = true
knowledge = "2025-04"
release_date = "2026-04-16"

[cost]
input = 5.00
output = 25.00
cache_read = 0.50
cache_write = 6.25

[limit]
context = 1_000_000
output = 128_000

[modalities]
input = ["text", "image", "pdf"]
output = ["text"]

覆盖范围

130+ 厂商,4,844 个模型。不仅包括第一方厂商(Anthropic、OpenAI、Google、xAI、DeepSeek、阿里、Mistral),还包括:

  • 云平台:AWS Bedrock、Azure、Google Vertex、Cloudflare Workers AI
  • AI Gateway:OpenRouter、Vercel AI Gateway、Helicone、NanoGPT
  • 推理服务商:Together AI、Fireworks AI、Groq、Cerebras、DeepInfra
  • 国内平台:阿里云、硅基流动(SiliconFlow)、零一万物、MiniMax、月之暗面
  • 开源部署:Ollama、LM Studio

怎么贡献

模型更新很快,社区维护是核心。添加新模型只需 4 步:

  1. providers/ 下找到(或创建)厂商目录
  2. 添加 models/模型名.toml 文件
  3. 填写规格、定价、能力字段
  4. 提交 PR

GitHub Action 会自动验证:必填字段是否齐全、数据类型是否正确、值是否在合理范围内。

对于第三方镜像/网关,支持 extends 继承原始模型定义,避免重复:

[extends]
from = "anthropic/claude-opus-4-7"
omit = ["experimental.modes.fast"]

[provider]
npm = "@ai-sdk/anthropic"

和其他对比工具的区别

维度 Models.dev Artificial Analysis LMSys Chatbot Arena
数据格式 结构化 JSON/TOML + API 网页可视化 排行榜
覆盖范围 4,844 个模型 ~100 个模型 ~50 个模型
集成方式 API 直接调用 无 API 无 API
开源 ✅ GitHub
维护方式 社区贡献 + PR 人工维护 众包评测
定价数据 统一格式,精确到缓存读写 基础定价

Models.dev 的独特价值在于:机器可读的结构化数据 + 社区维护保持新鲜 + 开源可自托管。它不是一个评测排行榜,而是一个可在应用中直接集成的模型信息数据库。

适用场景

  • 应用开发:动态选择最优模型(按价格、能力、上下文窗口筛选)
  • 成本优化:对比不同厂商的 token 定价,计算缓存节省
  • 技术选型:快速筛选支持特定能力(工具调用、推理、多模态)的模型
  • AI SDK 集成:Model ID 直接对应 AI SDK 的标识符,零配置切换

作者: itech001
来源: 公众号:AI人工智能时代
网站: https://www.theaiera.cn/
每日分享最前沿的AI新闻资讯和技术研究。

本文首发于 AI人工智能时代,转载请注明出处。