跳转到主要内容

文本转语音 (TTS)

POST /v1/audio/speech
将文本转换为自然语音,兼容 OpenAI TTS API 格式。

请求参数

参数类型必填说明
modelstring模型名称:gpt-4o-mini-ttstts-1tts-1-hd
inputstring要转换的文本,最长 4096 字符
voicestring语音角色
response_formatstring输出格式:mp3(默认)、opusaacflacwavpcm
speednumber语速,0.25-4.0,默认 1.0

可用语音

语音特点
alloy中性、平衡
echo男性、沉稳
fable男性、温暖
onyx男性、深沉
nova女性、活泼
shimmer女性、柔和

请求示例

curl -X POST https://crazyrouter.com/v1/audio/speech \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{
    "model": "gpt-4o-mini-tts",
    "input": "你好,欢迎使用 Crazyrouter API。今天天气真不错!",
    "voice": "nova",
    "response_format": "mp3",
    "speed": 1.0
  }' \
  --output speech.mp3
响应为音频文件的二进制流,直接保存即可。

模型对比

模型质量延迟说明
tts-1标准适合实时场景
tts-1-hd高清更自然的语音
gpt-4o-mini-tts最高最新模型,支持更多语言和情感
gpt-4o-mini-tts 支持多语言,会自动识别输入文本的语言并使用对应的发音。
响应为二进制音频流,不是 JSON。请使用 --output 或流式写入文件。