登录

OpenAI最智能AI语音模型:GPT


速读:GPT-Realtime-2专为实时交互设计,是首款具备GPT-5级推理能力的语音模型。
OpenAI 最智能 AI 语音模型:GPT-Realtime-2 登场,GPT-5 级推理能力

OpenAI 最智能 AI 语音模型:GPT-Realtime-2 登场,GPT-5 级推理能力

2026年05月08日 08:46

IT之家 5 月 8 日消息,OpenAI 发布三款实时语音模型,分别针对推理、翻译和转录场景,集成于 Realtime API 供开发者调用。这三款模型为实时语音应用提供底层技术支撑, 目标解决语音交互中的延迟、打断处理和多语言支持难题。

GPT-Realtime-2 专为实时交互设计,是首款具备 GPT-5 级推理能力的语音模型。它在保持对话自然流畅的前提下,能在对话过程中进行推理、调用工具,并处理用户的打断或纠正。这意味着开发者可以构建更复杂的语音助手,并能执行多步骤任务。

定价方面,GPT-Realtime-2 音频输入定价为每百万 Token 费用 32 美元(IT之家注:现汇率约合 218.1 元人民币),输出为 64 美元(现汇率约合 436.2 元人民币),缓存输入仅需 0.4 美元。

GPT-Realtime-Translate 支持 70 种输入语言转 13 种输出语言,翻译速度与说话者同步,适用于跨国会议或实时沟通场景。

GPT-Realtime-Whisper 则专注于低延迟流式转录,音频随说随转,让实时字幕和会议记录能跟上对话节奏,减少等待时间。翻译和转录模型按分钟计费,分别为每分钟 0.034 美元和 0.017 美元。

新浪众测

新浪众测

新浪科技公众号

新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

转播权报价高达21亿元 近乎是印度10倍!FIFA回应中国区天价世界杯版权

一张照片就能开锁!消协实测:智能门锁这些功能暗藏隐患

加拿大电动汽车市场迎来中国力量,比亚迪、吉利、奇瑞等加速布局

110 亿美元打水漂,本田加拿大电动汽车工厂项目或胎死腹中

全系标配华为智能 宝骏全尺寸SUV华境S明晚上市:有望15万起售

韩旭谈世界模型:咏春厉害,主要是叶问在打

清华团队新突破!用“分子积木”构建高比能锂硫电池

Tab键怎么成为Windows标配:微软资深工程师曝出38年前荒诞往事

苏州厂生产继续!三星宣布中国停售电视、显示器等在内所有家电产品 主因是卖太贵

中国信通院联合腾讯、华为等发起智能体可信握手协议(ATH),建立智能体开源社区

转播权报价高达21亿元 近乎是印度10倍!FIFA回应中国区天价世界杯版权

撕掉人傻钱多标签!因世界杯版权费21亿元硬刚国际足联 中国这次在争什么:定价权与尊重

29项全球第一!比亚迪大唐预售订单突破10万台

黄仁勋:中国绝不能有最新AI GPU!美国必须第一、必须最强

Manthey 套件加持,保时捷 Taycan Turbo GT 重回纽北最速量产电动车宝座

比亚迪大唐 EV 预售订单突破 10 万台,预售价 25 万元起

女演员起诉卡梅隆及迪士尼,指控《阿凡达》电影盗用其肖像

卷不动了?三星家电官宣退出中国市场,一个时代的落幕

蔚来 ES9 官宣 5 月 27 日上市并开启交付,电池租用预售价 42 万元起

中国强硬拒绝世界杯天价转播费上热搜:国际足联看人下菜被吐槽 漫天要价谈判僵持

主题:语音模型|OpenAI最智能AI语音模型|GPT-5级推理能力|翻译