跳转到主要内容

推理模型

本文页只写入 2026-03-22 已在 Crazyrouter 生产环境复核过的推理行为。 如果你在做 OpenAI 兼容接入,当前应按下面的方式理解:
  • 只需要更强推理能力,不要求看到思考摘要:可用 Chat Completions 的 reasoning_effort
  • 需要稳定拿到可观察的 reasoning 输出:优先用 Responses API,见 GPT-5 思考模式

已验证组合

路由模型请求参数当前生产表现
Chat Completionsgpt-5.4reasoning_effort请求成功,返回最终答案
Responsesgpt-5.4reasoning.effort / reasoning.summaryoutput 中返回 reasoningmessage item

Chat Completions: reasoning_effort

当前生产可直接使用:
cURL
curl https://crazyrouter.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{
    "model": "gpt-5.4",
    "messages": [
      {
        "role": "user",
        "content": "Which is larger, 9.11 or 9.9? Explain briefly."
      }
    ],
    "reasoning_effort": "high",
    "max_tokens": 120
  }'
reasoning_effort 可选值:
说明
low更快返回,适合简单问题
medium默认型平衡配置
high更偏向复杂推理

当前返回行为

2026-03-22 的生产复核中:
  • 请求可正常成功
  • 最终答案在 message.content
  • message.reasoning_content 字段当前未稳定给出可用内容
因此如果你只是想提高模型推理力度,可以继续用 reasoning_effort;如果你要依赖“可见的推理摘要字段”,不要把 Chat Completions 作为主方案。

需要可观察推理输出时

当前更稳的写法是直接使用 Responses API:
cURL
curl https://crazyrouter.com/v1/responses \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{
    "model": "gpt-5.4",
    "input": "Which is larger, 9.11 or 9.9? Explain briefly.",
    "reasoning": {
      "effort": "high",
      "summary": "detailed"
    }
  }'
当前生产验证返回的关键 output.type
["reasoning", "message"]
详细示例、摘要字段和流式事件名见:

当前建议

  • 新项目如果要记录或展示推理摘要,优先从 Responses API 起步
  • 老项目如果已经接在 Chat Completions 上,又只关心最终答案,可以继续使用 reasoning_effort
  • 不要假设所有 OpenAI 兼容推理模型都会稳定暴露 reasoning_content
推理请求通常会增加延迟和 Token 消耗。reasoning_effort 越高,成本通常也越高。