谷歌发布Gemini 2.0，三款AI Agent新产品，能搜网页、写代码、教你打游戏

速读：当地时间12月11日，谷歌突然发布了Gemini 2.0，这款全新的AI模型不仅能够独立完成复杂任务，还首次支持原生图像生成和多语言音频功能。

2024年12月12日 09:5

Agent 已然成为了科技公司在 AI 领域的新战场。

当地时间12月11日，谷歌突然发布了Gemini 2.0，这款全新的AI模型不仅能够独立完成复杂任务，还首次支持原生图像生成和多语言音频功能。

（来源：谷歌）同一天，OpenAI的“十二连发”活动进行到了第五天。不过这次直播略显平淡，只是演示了ChatGPT与苹果 Apple Intelligence 的整合。

相比之下，谷歌的发布可谓是“量大管饱”，抢尽了风头。

在新模型的加持下，谷歌一口气推出了三款 AI Agent（智能体）产品，标志着谷歌在与OpenAI、Anthropic和微软的竞争中迈出了重要一步。

（来源：谷歌博客、谷歌翻译）（来源：谷歌博客、谷歌翻译）谷歌DeepMind的CEO德米斯·哈萨比斯（Demis Hassabis）表示：“Gemini 2.0 实际上已经达到了目前 Gemini 1.5 Pro 的水平。这意味着在保持相同成本效率、性能效率和速度的同时，整体性能提升了一个档次。这个成果让我们非常满意。”

目前谷歌公布的是实验版Gemini 2.0 Flash。在官方数据对比中，新模型在编程、数学、推理、图像、视频等领域的处理能力均超越了Gemini 1.5 Pro，性能提升有目共睹。

图 | Gemini 2.0 Flash 的测试成绩（来源：谷歌）谷歌 Gemini 产品负责人图尔西·多希（Tulsee Doshi）在新闻发布会上介绍说：“我们知道 Flash 因其在速度和性能上的平衡而深受开发者欢迎。新版本不仅保持了同样的快速响应能力，而且功能更加强大。”

据悉，这次性能的提升并没有以牺牲功能为代价，新版本在运行速度上甚至比前代 Flash 模型快了一倍，同时在代码编写和图像分析等方面都有显著提升。

Gemini 2.0 的最大亮点是其“代理人工智能”（Agentic AI）功能。这种 AI 系统不再仅仅是被动地回答问题，而是能够理解复杂的上下文，提前规划多个步骤，并在用户授权下采取行动。

谷歌推出了三个基于 Gemini 2.0 架构的 AI 智能体原型，分别是 Project Astra、Project Mariner 和Jules，每一个都针对特定应用场景进行了优化。

此外，谷歌还演示了 AI 智能体如何跟玩家合作打游戏。在《部落冲突》的演示中，AI 可以介绍兵种特性并给出组合建议。它还能在 Reddit 上检索信息，为玩家提供角色选择建议。玩家全程都是用对话的形式与智能体互动的。

主题：谷歌|Gemini2.0