跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://docs.crazyrouter.com/llms.txt

Use this file to discover all available pages before exploring further.

模型官方定价方式

本文只解释上游厂商的官方计费口径,不等同于 Crazyrouter 的实际售价。
  • 上游官方口径:厂商自己的 inputoutputcached inputtool callsearch groundingprompt caching 等收费方式
  • Crazyrouter 口径:本站自己的售价、倍率、折扣、渠道差异与结算方式
本页按 2026-04-27 查询到的厂商官方文档整理。厂商会改价,也会调整预览模型、长上下文、搜索工具和缓存规则;上线前请再点官方链接核对一次。

官方单价示例表

以下示例只取各厂商最常见、最容易和业务预算直接对应的一档:
  • Anthropic:标准 API 价,不含 Fast modeUS-only inference 乘数和 Batch 折扣
  • OpenAI:Standard 价,不含 Batch、Priority、Regional Processing 加价
  • Gemini:Standard 价,默认按文本 / 图像 / 视频输入,且对 Gemini 3*<= 200K prompt
  • xAI:若站内路由名没有公开静态单列价,本表会明确写成“未单列”
  • Z.AI:取官方 Text Models
  • MiniMax:主表取 Pay as You Go,订阅制单独列 Token Plan
除特别标注外,下表金额默认都是 USD / 1M tokens

Anthropic 示例单价

站内模型官方对应Base InputCache 5m / 1h / HitOutput备注
claude-sonnet-4-6claude-sonnet-4-6$3$3.75 / $6 / $0.30$151M context 按标准价;Batch 约 5 折
claude-opus-4-6claude-opus-4-6$5$6.25 / $10 / $0.50$25Fast mode 另按 6x 标准价
claude-opus-4-7claude-opus-4-7$5$6.25 / $10 / $0.50$25若启用 US-only inference,官方另有地区乘数
claude-sonnet-4-5-20250929claude-sonnet-4-5 快照$3$3.75 / $6 / $0.30$15快照名沿用 Sonnet 4.5 价格,不是另一张价目表

OpenAI 示例单价

站内模型官方对应InputCached inputOutput备注
gpt-54gpt-5.4$2.50$0.25$15.00标准价适用于 270K 以下;超长上下文另有乘数
gpt-4ogpt-4o$2.50$1.25$10.00经典统一三段式计费
gpt-5gpt-5$1.25$0.125$10.00工具费另算
gpt-51-codex-maxgpt-5.1-codex-max$1.25$0.125$10.00常用于 Codex / agentic coding 工作流,价格结构仍是标准三段式
gpt-5-minigpt-5-mini$0.25$0.025$2.00小模型版本
gpt-5-nanogpt-5-nano$0.05$0.005$0.40最低价 GPT-5 路线
gpt-5.2gpt-5.2$1.75$0.175$14.00前代旗舰,仍是标准 token 三段式
gpt-5.5gpt-5.5$5.00$0.50$30.00当前官方旗舰价;标准价说明适用于 270K 以下上下文

Gemini 示例单价

站内模型官方对应Standard 输入价Standard 缓存价Standard 输出价备注
gemini-3-progemini-3-pro$2.00$0.20 + $4.50 / 1M tok / hr 存储$12.00<= 200K prompt 档;> 200K$4 / $0.40 / $18;Google 当前对 Gemini 3 家族还单列 Search / Maps 免费额度与 $14 / 1,000 search queries
gemini-2.5-flash-litegemini-2.5-flash-lite$0.10(text / image / video)$0.01(text / image / video) + $1.00 / 1M tok / hr 存储$0.40音频输入是 $0.30,音频缓存是 $0.03;Search 为 1,500 RPD 免费后 $35 / 1,000 grounded prompts

xAI 示例单价

站内模型官方对应Prompt / Cached / OutputTool 费用备注
grok-4.1-thinking站内 reasoning 路由官方静态公开页未单列 grok-4.1-thinking 独立单价web_search $5 / 1kx_search $5 / 1kcode_execution $5 / 1kattachment_search $10 / 1kcollections_search $2.50 / 1kreasoning tokenscompletion token price 收费
grok-4.1站内主路由官方静态公开页未单列 grok-4.1 独立单价同上站内名更像路由层名称,不应直接等同为 xAI 静态 SKU
xAI 当前公开静态文档能稳定核到的是 token 分类规则、tool invocation 费用、Batch 5 折 与“到模型详情页或 console 查看具体 per-model token price”。由于 grok-4.1 / grok-4.1-thinking 在静态文档里未单列价格,本页不把其他 SKU 的数字硬套给它们。

Z.AI / GLM 示例单价

站内模型官方对应InputCached inputCached input storageOutput备注
glm-5GLM-5$1.0$0.2Limited-time Free$3.2Web Search 另收 $0.01 / use

MiniMax 示例单价

Pay as You Go

站内模型官方对应InputPrompt caching readPrompt caching writeOutput备注
MiniMax-M27MiniMax-M2.7$0.3$0.06$0.375$1.2这是最适合直接做 API 预算的一档

Token Plan

套餐月费M2.7 配额
Starter$10 / month1,500 requests / 5hrs
Plus$20 / month4,500 requests / 5hrs
Max$50 / month15,000 requests / 5hrs

Anthropic

Anthropic 这组模型的官方计费方式不是简单的 input / output 两栏,而是拆成:
  • Base Input Tokens
  • 5m Cache Writes
  • 1h Cache Writes
  • Cache Hits & Refreshes
  • Output Tokens
同时还有两条共通规则:
  • Batch API 输入和输出通常按标准价 5 折
  • Prompt caching 的公开倍数规则是:5 分钟写缓存 = 1.25x input1 小时写缓存 = 2x input读缓存 = 0.1x input
站内模型名官方对应官方计费方式特别说明
claude-sonnet-4-6Anthropic claude-sonnet-4-6base input / 5m cache write / 1h cache write / cache hit / output 计费Anthropic 官方已明确 Sonnet 4.6 支持 1M context,且该长上下文按标准单价计费,不额外抬价
claude-opus-4-6Anthropic claude-opus-4-6base input / 5m cache write / 1h cache write / cache hit / output 计费Opus 4.6 也支持 1M context 标准计费;另外官方单独提供 Fast mode,价格是标准价 6x
claude-opus-4-7Anthropic claude-opus-4-7base input / 5m cache write / 1h cache write / cache hit / output 计费Opus 4.7 是当前 Anthropic 官方公开价目里的独立型号;如果启用 US-only inference,官方文档说明会有 1.1x 乘数
claude-sonnet-4-5-20250929Anthropic 快照 ID claude-sonnet-4-5-20250929,公开别名通常写作 claude-sonnet-4-5仍按 Sonnet 4.5base input / cache write / cache hit / output 计费这是带日期的 API 快照名,不是另一套单独价格;预算时应按 Claude Sonnet 4.5 官方口径理解
官方链接:

OpenAI

OpenAI 这组文本模型的官方公开口径最统一,核心都是:
  • Input
  • Cached input
  • Output
额外规则通常是:
  • Responses API 本身不单独加价,仍按所选模型的 token 单价计费
  • Web search、容器/代码执行、Computer Use 等工具按工具收费,不包含在纯 token 单价里
  • Batch API 输入和输出通常按标准价 5 折
站内模型名官方对应官方计费方式特别说明
gpt-54站内别名,通常对应 OpenAI gpt-5.4input / cached input / output 计费gpt-5.4 的公开标准价适用于 270K 以下上下文;区域处理端点另有 +10%
gpt-4oOpenAI gpt-4oinput / cached input / output 计费gpt-4o 是经典统一口径,没有 Claude 那种单独缓存写入栏位,也没有 Gemini 那种 Search grounding 单独表
gpt-5OpenAI gpt-5input / cached input / output 计费如果在 Responses API 里开工具,工具费用另算;公开价格页没有单列“thinking token 单价”
gpt-51-codex-max站内应对应 OpenAI gpt-5.1-codex-maxinput / cached input / output 计费这是 Codex 取向型号,但公开价格结构仍与普通 GPT-5.1 文本模型一致;更适合 agentic coding / Codex 工作流理解
gpt-5-miniOpenAI gpt-5-miniinput / cached input / output 计费小模型版本,结构不变,只是单价更低
gpt-5-nanoOpenAI gpt-5-nanoinput / cached input / output 计费Nano 版本同样沿用标准 token 三段式计费
gpt-5.2OpenAI gpt-5.2input / cached input / output 计费gpt-5.2 仍属于 GPT-5 系列标准口径;如果调用 Web search / File search / Code interpreter,工具另计
gpt-5.5OpenAI gpt-5.5input / cached input / output 计费当前 OpenAI 官方把它列为旗舰模型;公开价格页说明标准价适用于 270K 以下上下文,超长上下文应再看最新详细价目
官方链接:

Google Gemini

Gemini 的官方计费方式与前两家差别最大,通常不只一个标准价,而是同时给出:
  • Standard
  • Batch
  • Flex
  • Priority
并且会单独列出:
  • Input
  • Output (including thinking tokens)
  • Context caching price
  • Context caching storage
  • Grounding with Google Search
  • Grounding with Google Maps
站内模型名官方对应官方计费方式特别说明
gemini-3-proGoogle gemini-3-pro,站内展示名通常可写作 gemini-3-pro官方按 Standard / Batch / Flex / Priority 四种处理模式分别计费,并对每种模式拆出 input / output / caching / search grounding / maps grounding这是预览模型;并且 <= 200K> 200K prompt 是两档价格,不是单一单价
gemini-2.5-flash-liteGoogle gemini-2.5-flash-liteStandard / Batch / Flex / Priority 分档计费,并单列 input / output / context caching / storage / Google Search / Google Maps这是稳定型号,不是 preview;其 output 官方明确写成“包含 thinking tokens”
官方链接:

xAI Grok

xAI 的官方规则重点不是“thinking 模型有没有另一张价格表”,而是把 token 和工具拆开:
  • Prompt tokens
  • Cached prompt tokens
  • Completion tokens
  • Reasoning tokens
xAI 官方还特别说明:
  • Reasoning tokenscompletion token price 收费
  • Web SearchX SearchCode ExecutionCollections Search 等 server-side tools 按 每 1000 次调用 单独收费
  • Batch API 对 token 类费用通常是 5 折
站内模型名官方对应官方计费方式特别说明
grok-4.1-thinking站内 reasoning 路由;官方语义上对应 Grok 4.1 的 Thinking 配置官方口径是 prompt / cached prompt / completion / reasoning 四类 token,加上需要时的 tool invocation 费用当前 xAI 公开 API 价目页重点展示的是 grok-4-1-fast-reasoning 这类 SKU;因此这里更准确的理解是“按 xAI reasoning 模型官方计费结构结算”,而不是把站内名当成独立官方 SKU
grok-4.1站内 Grok 4.1 主路由;官方语义上更接近 Grok 4.1 的非思考配置官方口径仍是 prompt / cached prompt / completion,如果开搜索、代码执行、附件检索等工具则另算 tool feexAI 当前公开 API 页面已更强调 grok-4.20grok-4-1-fast-*;因此预算时应重点看 xAI 当前公开的 token 类和 tool 类收费规则
官方链接:

Z.AI / GLM

Z.AI 的 GLM-5 官方口径和 OpenAI 类似,但又多了一项缓存存储费:
  • Input
  • Cached Input
  • Cached Input Storage
  • Output
同时内置工具如 Web Search 会按使用次数单独收费。
站内模型名官方对应官方计费方式特别说明
glm-5Z.AI GLM-5input / cached input / cached input storage / output 计费如果启用官方内置 Web Search,还会按 per use 额外收费;这和只看 token 单价不同
官方链接:

MiniMax

MiniMax 这组模型要先区分两种官方售卖方式:
  • Pay as You Go
  • Token Plan
其中:
  • Pay as You Go 是标准 API 按量计费
  • Token Plan 是订阅制,M2.75 小时滚动窗口的请求额度 计,不是单纯按 token 结算
站内模型名官方对应官方计费方式特别说明
MiniMax-M27站内应对应 MiniMax-M2.7如果走 Pay as You Go,按 input / output / prompt caching read / prompt caching write 计费;如果走 Token Plan,则按 requests / 5hrs 的订阅额度计这是本页里最不一样的一家。做生产预算时,优先看 Pay as You Go;做开发者重度编码使用时,再看 Token Plan 是否更划算
官方链接:

结论

如果你只是想快速判断“官方到底按什么收费”,可以直接记这几类:
  • Anthropic:base input + cache write/read + output
  • OpenAI:input + cached input + output,工具另计
  • Gemini:多处理模式 + input/output + caching + search/maps grounding
  • xAI:prompt/cached/completion/reasoning,server-side tools 另计
  • Z.AI:input + cached input + cached storage + output
  • MiniMax:按量 token订阅额度 两套并存
本页解释的是“上游官方定价方式”,不是 Crazyrouter 对外售卖价格。实际充值、扣费、倍率和优惠,请以 Crazyrouter 站内 pricing、控制台和 /api/pricing 返回为准。

站内相关页面