登录

OpenAI直播最后一天放出“王炸”:下一代推理模型o 3亮相


速读:周五,OpenAI发布了下一代的推理模型o3。 OpenAI声称,至少在某些条件下,o3模型可以接近实现AGI。 o3有多强大?
2024年12月21日 16:55

OpenAI将其最为重要的尖端产品,放在了为期12天的技术分享直播活动的最后一天!

周五,OpenAI发布了下一代的推理模型o3,这是今年早些时候发布的o1推理模型的升级版本。更准确地说,o3是一个模型系列——就像o1一样,同时有o3和o3-mini两个版本,后者是一款更小的精简版模型,针对特定任务进行了微调。

OpenAI声称,至少在某些条件下,o3模型可以接近实现AGI。

AGI是“通用人工智能”(artificial general intelligence)的缩写,泛指能完成人类所能完成的任何任务的人工智能。OpenAI对此有着自己的定义:“在最具经济价值的工作上胜过人类的高度自主系统”。

实现AGI将是一个大胆的宣言。对于OpenAI来说,其背后也将具有现实意义。根据OpenAI与其亲密合作伙伴和投资方微软的协议条款,一旦OpenAI达到AGI,就没有义务再让微软使用其最先进的技术(即那些符合OpenAI AGI定义的技术)。

OpenAI首席执行官山姆·奥尔特曼(Sam Altman)介绍称,OpenAI计划在1月底前正式推出o3 mini,之后推出完整版的o3。该公司期待更强大的大型语言模型可以超越现有模型,吸引新的投资和用户。

OpenAI在一篇博客文章中表示,o1模型已经能够推理复杂的任务,与以前的科学、编码和数学模型相比,它能解决更具挑战性的问题。而OpenAI新推出的o3和o3 mini模型目前正在进行内部安全测试,它们将比之前推出的o1模型更加强大。

OpenAI两年前发布了ChatGPT,拉开了AI军备竞赛的序幕。ChatGPT是一款聊天机器人,最初由版本为GPT-3.5的大型语言模型驱动。OpenAI 随后在2023年推出了GPT-4,并称其更准确、更具创造性。最近,OpenAI又推出了其首个推理模型o1。

该公司发言人表示,OpenAI决定不将下一代新模型命名为o2,“是出于对同名英国电信运营商o2的尊重”。奥尔特曼当天在直播中也调侃称,“按照OpenAI非常非常不擅长命名的伟大传统,它将被命名为o3。”

o3有多强大?

那么,o3具体的表现究竟能有多强大呢?

根据OpenAI的介绍,o3模型在ARC-AGI基准上获得了破纪录的分数。ARC-AGI由Keras之父Fran ? ois Chollet开发, 主要是通过图形逻辑推理来测试模型的推理能力。以100%为最高分的ARC-AGI评估结果显示,在低计算场景中,o3得分为75.7%,而在高计算测试中,它达到了87.5%。

主题:o3|下一代