推理模型

本文页只写入 2026-03-22 已在 Crazyrouter 生产环境复核过的推理行为。如果你在做 OpenAI 兼容接入，当前应按下面的方式理解：

只需要更强推理能力，不要求看到思考摘要：可用 Chat Completions 的 reasoning_effort
需要稳定拿到可观察的 reasoning 输出：优先用 Responses API，见 GPT-5 思考模式

已验证组合

路由	模型	请求参数	当前生产表现
Chat Completions	`gpt-5.4`	`reasoning_effort`	请求成功，返回最终答案
Responses	`gpt-5.4`	`reasoning.effort` / `reasoning.summary`	`output` 中返回 `reasoning` 与 `message` item

Chat Completions: `reasoning_effort`

当前生产可直接使用：

cURL

curl https://crazyrouter.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{
    "model": "gpt-5.4",
    "messages": [
      {
        "role": "user",
        "content": "Which is larger, 9.11 or 9.9? Explain briefly."
      }
    ],
    "reasoning_effort": "high",
    "max_tokens": 120
  }'

reasoning_effort 可选值：

值	说明
`low`	更快返回，适合简单问题
`medium`	默认型平衡配置
`high`	更偏向复杂推理

当前返回行为

在 2026-03-22 的生产复核中：

请求可正常成功
最终答案在 message.content
message.reasoning_content 字段当前未稳定给出可用内容

因此如果你只是想提高模型推理力度，可以继续用 reasoning_effort；如果你要依赖“可见的推理摘要字段”，不要把 Chat Completions 作为主方案。

需要可观察推理输出时

当前更稳的写法是直接使用 Responses API：

cURL

curl https://crazyrouter.com/v1/responses \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{
    "model": "gpt-5.4",
    "input": "Which is larger, 9.11 or 9.9? Explain briefly.",
    "reasoning": {
      "effort": "high",
      "summary": "detailed"
    }
  }'

当前生产验证返回的关键 output.type：

["reasoning", "message"]

详细示例、摘要字段和流式事件名见：

当前建议

新项目如果要记录或展示推理摘要，优先从 Responses API 起步
老项目如果已经接在 Chat Completions 上，又只关心最终答案，可以继续使用 reasoning_effort
不要假设所有 OpenAI 兼容推理模型都会稳定暴露 reasoning_content

推理请求通常会增加延迟和 Token 消耗。reasoning_effort 越高，成本通常也越高。

结构化输出 Web 搜索

Documentation Index

​推理模型

​已验证组合

​Chat Completions: reasoning_effort

​当前返回行为

​需要可观察推理输出时

​当前建议

推理模型

已验证组合

Chat Completions: `reasoning_effort`

当前返回行为

需要可观察推理输出时

当前建议