二零二六年人工智能API定价：汝实付之GPT-5.5、Claude Opus、Gemini及二十余模型

GPT-5.5上三十美元之提示，于DeepSeek V4 Flash仅需二八角。百倍之差——此实情也。

若尔建于AI API之上，二六年间之价局，纷繁殊甚。四大家供，二十以上之模，价级涵缓存读、缓存写、批量折、促销价、隐阈之属。吾制一符文价算器。以明其理。此乃其价目之据也。

所列之价，皆以百万单位（MTok）计，用美元标示，源自官方之文牍，时在二零二六年五月。

诸模，依价而序

尽览其象——凡二十模，自廉至贵，列于输入之次：

* 深寻V4 Pro：至2026年5月31日享七五折优惠.

比率之列，乃输出入价之比。深寻之2倍比率，谓输出符文较输入者价廉甚——若汝之应用多生长文，则此甚要.

模式	输入	输出	月度（每日需10K）*
Gemini 3.1 Pro	$2.00	$12.00	$3,900
Claude Opus 4.7	$5.00	$25.00	$6,375
GPT-5.5	$5.00	$三十元	$七千五百元

*每请求数据五千输入，五百输出

Gemini 3.1 Pro输入费用较GPT-5.5减半。然超二十万token之提示，其价倍增——此隐匿之费，人猝不及防

模型	输入	输出	月度（每日需10K）
Gemini 2.5 Pro	$1.25	$10.00	$3,375
GPT-5.4	$2.50	$15.00	$6,000
Claude Sonnet 4.6	$3.00	$15.00	$6,375

模式	输入	输出	月度（每日需10K）
Gemini 2.5 闪存版	$0.10	$0.40	$30
DeepSeek V4 闪存版	$0.14	$0.28	$71
GPT-5.4 微型版	$0.20	$1.25	$75
Claude Haiku 4.5	$1.00	$5.00	$300

若汝之应用反复发送同系统提示或工具定义，缓存之效重于基准定价。诸提供者皆于缓存之令牌省约九成，唯DeepSeek者，得九八至九九之省。

其难处在于：Anthropic于缓存写入收取25%之溢价。初次Opus处理前缀，尔付6.25元/兆，而非5元。此意即缓存仅能省费，若尔于缓存TTL窗口内三次以上发送同前缀。OpenAI与Google不收此溢价，但予尔折扣。

当用预算模型时：

当守前沿之模者：

最睿智之架构，将九成之流导向价廉（$0.10/M）之模，而留价昂（$5.00/M）之模，供百中十之一实需之用.

AI API 之价已崩。最廉与最昂之模，输入相差三百倍，输出相差四百五十倍。其要，在配模于事。勿以 GPT-5.5 之价，以分邮件。勿以 Flash-Lite，以书繁码。用缓存之术，择适之级，则 API 之账，自巨项为微差。

凡二十余器之价目表，具缓存读写之阶次，批价之法，及专供之注：全API价目之较

吾制tokencostcalc.com——一免费之符价计算器。无广，无联属，无踪迹。但择一器，入符之用，即见实价。