OpenAI最智能AI语音模型:GPT
OpenAI 最智能 AI 语音模型:GPT-Realtime-2 登场,GPT-5 级推理能力
2026年05月08日 08:46
IT之家 5 月 8 日消息,OpenAI 发布三款实时语音模型,分别针对推理、翻译和转录场景,集成于 Realtime API 供开发者调用。这三款模型为实时语音应用提供底层技术支撑, 目标解决语音交互中的延迟、打断处理和多语言支持难题。
GPT-Realtime-2 专为实时交互设计,是首款具备 GPT-5 级推理能力的语音模型。它在保持对话自然流畅的前提下,能在对话过程中进行推理、调用工具,并处理用户的打断或纠正。这意味着开发者可以构建更复杂的语音助手,并能执行多步骤任务。
定价方面,GPT-Realtime-2 音频输入定价为每百万 Token 费用 32 美元(IT之家注:现汇率约合 218.1 元人民币),输出为 64 美元(现汇率约合 436.2 元人民币),缓存输入仅需 0.4 美元。
GPT-Realtime-Translate 支持 70 种输入语言转 13 种输出语言,翻译速度与说话者同步,适用于跨国会议或实时沟通场景。
GPT-Realtime-Whisper 则专注于低延迟流式转录,音频随说随转,让实时字幕和会议记录能跟上对话节奏,减少等待时间。翻译和转录模型按分钟计费,分别为每分钟 0.034 美元和 0.017 美元。



新浪科技公众号
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

转播权报价高达21亿元 近乎是印度10倍!FIFA回应中国区天价世界杯版权
一张照片就能开锁!消协实测:智能门锁这些功能暗藏隐患
加拿大电动汽车市场迎来中国力量,比亚迪、吉利、奇瑞等加速布局
110 亿美元打水漂,本田加拿大电动汽车工厂项目或胎死腹中
全系标配华为智能 宝骏全尺寸SUV华境S明晚上市:有望15万起售
韩旭谈世界模型:咏春厉害,主要是叶问在打
清华团队新突破!用“分子积木”构建高比能锂硫电池
Tab键怎么成为Windows标配:微软资深工程师曝出38年前荒诞往事
苏州厂生产继续!三星宣布中国停售电视、显示器等在内所有家电产品 主因是卖太贵
中国信通院联合腾讯、华为等发起智能体可信握手协议(ATH),建立智能体开源社区
转播权报价高达21亿元 近乎是印度10倍!FIFA回应中国区天价世界杯版权
撕掉人傻钱多标签!因世界杯版权费21亿元硬刚国际足联 中国这次在争什么:定价权与尊重
29项全球第一!比亚迪大唐预售订单突破10万台
黄仁勋:中国绝不能有最新AI GPU!美国必须第一、必须最强
Manthey 套件加持,保时捷 Taycan Turbo GT 重回纽北最速量产电动车宝座
比亚迪大唐 EV 预售订单突破 10 万台,预售价 25 万元起
女演员起诉卡梅隆及迪士尼,指控《阿凡达》电影盗用其肖像
卷不动了?三星家电官宣退出中国市场,一个时代的落幕
蔚来 ES9 官宣 5 月 27 日上市并开启交付,电池租用预售价 42 万元起
中国强硬拒绝世界杯天价转播费上热搜:国际足联看人下菜被吐槽 漫天要价谈判僵持