跳转到主要内容

GPT Realtime

GET /v1/realtime
GPT Realtime API 通过 WebSocket 连接实现低延迟的实时语音对话。

连接方式

通过 WebSocket 连接到 Realtime 端点:
wss://crazyrouter.com/v1/realtime?model=gpt-4o-realtime-preview

认证

在 WebSocket 连接的请求头中传入 API Key:
Authorization: Bearer YOUR_API_KEY
或通过 URL 参数:
wss://crazyrouter.com/v1/realtime?model=gpt-4o-realtime-preview&api_key=YOUR_API_KEY

支持的模型

模型说明
gpt-4o-realtime-previewGPT-4o 实时预览版
gpt-4o-mini-realtime-previewGPT-4o Mini 实时预览版

使用示例

Python
import asyncio
import websockets
import json

async def realtime_chat():
    uri = "wss://crazyrouter.com/v1/realtime?model=gpt-4o-realtime-preview"
    headers = {"Authorization": "Bearer YOUR_API_KEY"}

    async with websockets.connect(uri, extra_headers=headers) as ws:
        # 配置会话
        await ws.send(json.dumps({
            "type": "session.update",
            "session": {
                "modalities": ["text", "audio"],
                "voice": "nova",
                "input_audio_format": "pcm16",
                "output_audio_format": "pcm16",
                "turn_detection": {
                    "type": "server_vad"
                }
            }
        }))

        # 发送文本消息
        await ws.send(json.dumps({
            "type": "conversation.item.create",
            "item": {
                "type": "message",
                "role": "user",
                "content": [
                    {"type": "input_text", "text": "你好,请介绍一下你自己"}
                ]
            }
        }))

        # 触发响应
        await ws.send(json.dumps({"type": "response.create"}))

        # 接收响应
        async for message in ws:
            event = json.loads(message)
            if event["type"] == "response.text.delta":
                print(event["delta"], end="")
            elif event["type"] == "response.done":
                break

asyncio.run(realtime_chat())

事件类型

客户端事件

事件说明
session.update更新会话配置
conversation.item.create创建对话项
input_audio_buffer.append追加音频数据
input_audio_buffer.commit提交音频缓冲
response.create触发模型响应

服务端事件

事件说明
session.created会话已创建
response.text.delta文本增量
response.audio.delta音频增量
response.done响应完成
Realtime API 使用 WebSocket 长连接,请确保客户端支持 WebSocket 协议。连接超时默认为 120 秒。