谷歌发布Gemini 2.0,三款AI Agent新产品,能搜网页、写代码、教你打游戏
Agent 已然成为了科技公司在 AI 领域的新战场。
当地时间12月11日,谷歌突然发布了Gemini 2.0,这款全新的AI模型不仅能够独立完成复杂任务,还首次支持原生图像生成和多语言音频功能。
(来源:谷歌) 同一天,OpenAI的“十二连发”活动进行到了第五天。不过这次直播略显平淡,只是演示了ChatGPT与苹果 Apple Intelligence 的整合。
相比之下,谷歌的发布可谓是“量大管饱”,抢尽了风头。
在新模型的加持下,谷歌一口气推出了三款 AI Agent(智能体)产品,标志着谷歌在与OpenAI、Anthropic和微软的竞争中迈出了重要一步。
(来源:谷歌博客、谷歌翻译 ) 谷歌DeepMind的CEO德米斯·哈萨比斯(Demis Hassabis)表示:“Gemini 2.0 实际上已经达到了目前 Gemini 1.5 Pro 的水平。这意味着在保持相同成本效率、性能效率和速度的同时,整体性能提升了一个档次。这个成果让我们非常满意。”
目前谷歌公布的是实验版Gemini 2.0 Flash。在官方数据对比中,新模型在编程、数学、推理、图像、视频等领域的处理能力均超越了Gemini 1.5 Pro,性能提升有目共睹。
图 | Gemini 2.0 Flash 的测试成绩(来源:谷歌) 谷歌 Gemini 产品负责人图尔西·多希(Tulsee Doshi)在新闻发布会上介绍说:“我们知道 Flash 因其在速度和性能上的平衡而深受开发者欢迎。新版本不仅保持了同样的快速响应能力,而且功能更加强大。”
据悉,这次性能的提升并没有以牺牲功能为代价,新版本在运行速度上甚至比前代 Flash 模型快了一倍,同时在代码编写和图像分析等方面都有显著提升。
Gemini 2.0 的最大亮点是其“代理人工智能”(Agentic AI)功能。这种 AI 系统不再仅仅是被动地回答问题,而是能够理解复杂的上下文,提前规划多个步骤,并在用户授权下采取行动。
谷歌推出了三个基于 Gemini 2.0 架构的 AI 智能体原型,分别是 Project Astra、Project Mariner 和Jules,每一个都针对特定应用场景进行了优化。
此外,谷歌还演示了 AI 智能体如何跟玩家合作打游戏。在《部落冲突》的演示中,AI 可以介绍兵种特性并给出组合建议。它还能在 Reddit 上检索信息,为玩家提供角色选择建议。玩家全程都是用对话的形式与智能体互动的。