推理模型
推理模型(Reasoning Models)在回答前会进行深度思考,适合数学、编程、逻辑推理等复杂任务。Crazyrouter 支持多种推理模型,并提供推理深度控制。支持的推理模型
| 模型 | 说明 |
|---|---|
o4-mini | OpenAI 推理模型,平衡速度和能力 |
o3 | OpenAI 高级推理模型 |
o3-mini | OpenAI 轻量推理模型 |
deepseek-r1 | DeepSeek 推理模型 |
deepseek-v3-1 | DeepSeek V3.1 |
claude-sonnet-4-20250514 | Claude 支持 extended thinking |
gemini-2.5-flash-thinking | Gemini 思考模型 |
reasoning_effort 参数
通过reasoning_effort 控制模型的推理深度:
| 值 | 说明 |
|---|---|
low | 快速回答,适合简单问题 |
medium | 适度推理,平衡速度和质量 |
high | 深度推理,适合复杂问题 |
thinking 参数(思考预算)
部分模型支持通过thinking 参数精确控制思考 Token 预算:
Python
使用
thinking 参数时,max_tokens 必须大于 budget_tokens,因为 max_tokens 包含了思考 Token 和输出 Token。流式推理
推理模型也支持流式输出。思考过程和最终回答会分别以不同的 chunk 返回:Python
DeepSeek 推理模型
DeepSeek 推理模型会在响应中返回思考过程:Python
推理模型通常不支持
temperature、top_p 等采样参数。如果传入这些参数,可能会被忽略或返回错误。