


























每日请求量
| 提供商 | 型号 | 在 $/1M | 输出 $/1M | 每日 | 每月 |
|---|
定价更新于2026年5月25日。价格来源于每个提供商的官方文档(如果可用);否则来源于公共OpenRouter模型列表。在决定支出前,请务必与您的服务商的定价页面进行核对。批量处理 = 标准费率50%折扣(大多数服务商适用)。缓存 = 输入令牌成本90%折扣(提示缓存)。实际折扣因服务商而异。Meta/Llama的定价代表了主要云服务商(AWS Bedrock、Together AI)的收费标准。
AI API 成本取决于三个主要因素:你发出的请求数量、每个请求中包含的文本量(输入 token)、模型生成的内容量(输出 token)。这个计算器将你的使用模式与每个主要模型的定价相乘,以展示完整的成本情况。
大多数提供者提供批量处理 享受标准费率50%的折扣。您无需实时响应,而是批量提交请求,并在24小时内获得结果。适用于:数据标注、内容生成、文档处理以及任何对延迟不敏感的工作流程.
提示缓存(可在Anthropic、OpenAI和Google上使用)存储您的系统提示并在多个请求中重复使用。缓存的输入标记成本比未缓存的低约90%。当您有一个大型的、静态的系统提示(指令、示例、文档),并且在许多请求中保持不变时,这是最有效的。
输出标记通常比3-6倍更贵比输入标记消耗更多计算资源。这是因为生成文本比读取文本需要更多的计算能力。在优化成本时,减少输出长度(更短的回复、结构化的输出格式)通常比减少输入长度有更大的影响。
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。