← 返回 AI 热点新闻 OpenAI 发布 GPT-4o mini 与 Realtime API
访问首页
🚀 今日头条 发布日期:2024-07-18 来源:OpenAI 官方博客

OpenAI 正式发布 GPT-4o mini——一款兼顾性能与成本的多模态模型,并同步上线支持语音流式交互的 Realtime API。新版能力让开发者能够在网页、移动端乃至硬件设备上构建更加自然的语音助手、实时翻译与协作工具。

关键参数

  • · GPT-4o mini 输入 / 输出价格分别为 0.15 / 0.60 美元 / 百万 tokens。
  • · 默认上下文长度 128K tokens,可处理长文档与多轮对话。
  • · Realtime API 支持双向流式音频、文本与工具调用。

适用场景

  • · 构建实时语音助理、会议记录与智能客服。
  • · 在移动端实现低延迟的翻译、配音与课堂辅助。
  • · 借助 Responses API 优化知识库检索与复杂自动化流程。

同时亮相的 ChatGPT 桌面应用为 Realtime API 提供了最佳实践示范:用户可以通过语音、屏幕共享与模型协同完成会议记录、代码讲解与界面设计等任务。OpenAI 还宣布向开发者开放音频输出、情绪控制与设备连接功能,以满足更丰富的应用需求。

对产品与业务团队的启示

团队行动建议

建议优先评估现有语音或客服流程中对实时反馈的需求,基于 Realtime API 设计 MVP。对于需要跨平台部署的产品,可结合 WebRTC 与移动端 SDK 实现快速上线。

原文与延伸阅读