推理模型
本文页只写入2026-03-22 已在 Crazyrouter 生产环境复核过的推理行为。
如果你在做 OpenAI 兼容接入,当前应按下面的方式理解:
- 只需要更强推理能力,不要求看到思考摘要:可用 Chat Completions 的
reasoning_effort - 需要稳定拿到可观察的 reasoning 输出:优先用 Responses API,见 GPT-5 思考模式
已验证组合
| 路由 | 模型 | 请求参数 | 当前生产表现 |
|---|---|---|---|
| Chat Completions | gpt-5.4 | reasoning_effort | 请求成功,返回最终答案 |
| Responses | gpt-5.4 | reasoning.effort / reasoning.summary | output 中返回 reasoning 与 message item |
Chat Completions: reasoning_effort
当前生产可直接使用:
cURL
reasoning_effort 可选值:
| 值 | 说明 |
|---|---|
low | 更快返回,适合简单问题 |
medium | 默认型平衡配置 |
high | 更偏向复杂推理 |
当前返回行为
在2026-03-22 的生产复核中:
- 请求可正常成功
- 最终答案在
message.content message.reasoning_content字段当前未稳定给出可用内容
reasoning_effort;如果你要依赖“可见的推理摘要字段”,不要把 Chat Completions 作为主方案。
需要可观察推理输出时
当前更稳的写法是直接使用 Responses API:cURL
output.type:
当前建议
- 新项目如果要记录或展示推理摘要,优先从 Responses API 起步
- 老项目如果已经接在 Chat Completions 上,又只关心最终答案,可以继续使用
reasoning_effort - 不要假设所有 OpenAI 兼容推理模型都会稳定暴露
reasoning_content