谷歌AI全家桶深夜爆更：Gemini 3.5新王登场，数十亿人搜索变天，AI眼镜终于来了

速读：智东西5月20日报道，今日凌晨，在一年一度的谷歌I/O开发者大会上，谷歌接连甩出2款新模型、谷歌搜索25年最大升级、ClaudeCode谷歌版开发平台Antigravity2.0、AI眼镜等多个大招！首先用户可以通过对话进行视频剪辑，例如重塑视频中的环境，通过微调细节或者以现有视频为蓝本，打造出用气泡做雕塑等现实情况无法实现的视频内容。最后，其能将用户输入的图像、文本、视频、音频等任意参考内容，生成一个统一的视频。目前，Gemini3.5Flash已经在GeminiApp、谷歌搜索的AIMode中集成。

2026年05月20日 07:44

　　炒股就看金麒麟分析师研报，权威，专业，及时，全面，助您挖掘潜力主题机会！

（来源：智东西）

智东西

作者程茜陈佳

编辑云鹏

智东西5月20日报道，今日凌晨，在一年一度的谷歌I/O开发者大会上，谷歌接连甩出 2款新模型、谷歌搜索25年最大升级、Claude Code谷歌版开发平台Antigravity 2.0、AI眼镜等多个大招！

谷歌CEO桑达尔·皮查伊（Sundar Pichai）称，这次谷歌I/O大会的新发布，意味着其已正式迈入智能体驱动的Gemini时代。皮查伊一开场就放出了自己形象生成的AI视频，暗戳戳秀了一波自家AI能力。

1、新发2款大模型：可基于任意输入形式、生成各类模态输出内容的全能模型Gemini Omini，其首款模型 Gemini Omni Flash 将率先支持视频输出；谷歌最新、最强旗舰模型 Gemini 3.5 Flash 亮相，每秒输出token数是OpenAI、Anthropic模型的 4倍。

2、开发平台Google Antigravity升级：谷歌基于Gemini 3.5 Flash升级了Google Antigravity、Gemini App上的全天候个人智能体Gemini Spark、谷歌搜索，其宣布此次是谷歌搜索25年来最大更新。

3、谷歌官宣AI眼镜新进展：联合三星展示了由眼镜品牌Gentle Monster和Warby Parker共同设计的两款新眼镜。谷歌纯音频AI眼镜将在今年晚些时候率先推出，带显示屏的版本将在明年推出。

4、其他大招：Gemini App中的日报智能体Daily Brief、购物中心智能体Universal Cart、 AI图像创建和编辑工具Google Pics、Google Flow智能体等。

发布会开场，皮查伊官宣了几组数据：一年时间，谷歌旗下各类业务平台每月处理token暴涨7倍，突破 3200万亿token 。目前每月有超过 850万开发者利用谷歌的模型开发新应用和新体验，模型API目前每分钟处理大约 190亿token ，过去12个月有超过375名谷歌云客户各自处理了超过一万亿token 。

产品的用户量方面，如今谷歌有13款产品的用户超过10亿，其中5款用户超过 30亿；AI Overviews现在拥有超过 25亿月活跃用户，仅一年时间，谷歌搜索AI Mode的月活跃用户就已突破 10亿；Gemini应用的月活跃用户已突破 9亿，每日请求增长了七倍以上；Nano Banana图像生成模型已生成超过 500亿张图像。

在资本支出上，谷歌今年的资本支出将达到2022年的约6倍，约为 1800亿至1900亿美元（约合人民币1.2万亿至1.3万亿元），这项投资的关键部分就是谷歌TPU。谷歌还特地为TPU制作了动画短片。

本届谷歌I/O大会依旧信息量爆棚，智东西带你一文看尽。

一、全能模型Omni亮相，自然语言对话就能改视频

谷歌推出全新模型系列Gemini Omni，可依托任意输入内容生成各类内容，目前其率先支持视频输出，未来会支持图像、文本输出。

谷歌Omni家族的首款模型是Gemini Omni Flash，用户可以在Gemini应用、Google Flow和YouTube Shorts上试用。谷歌将在未来几周通过API向开发者和企业客户推广。

首先用户可以通过对话进行视频剪辑，例如重塑视频中的环境，通过微调细节或者以现有视频为蓝本，打造出用气泡做雕塑等现实情况无法实现的视频内容。

Omini还能对视频中的动作、物品进行修改。谷歌DeepMind CEO戴密斯·哈萨比斯（Demis Hassabis）在现场演示了Omini的效果，其修改提示词为：全程保留原视频所有画面与叙事，仅在4.3秒男子手指触碰镜面的瞬间触发特效：镜面以指尖为圆心，泛起液态水波纹般的涟漪；房间整体环境瞬间暗化；海量可自主变形、具备照片级真实质感的多几何造型3D棱镜，同时布满整个房间空间。

其次，Omni还能结合世界知识推演视频的后续情节走向，例如其能理解重力、流体力学等物理概念，创造出弹珠快速滚动的流畅镜头。

此外，其还能通过简短的提示，生成更为复杂的内容，例如用黏土动画解说蛋白质折叠的概念。

最后，其能将用户输入的图像、文本、视频、音频等任意参考内容，生成一个统一的视频。不过目前其只支持语音类参考素材，后续很快会上线其他类型音频输入能力。例如当用户上传角色、场景、音频素材，Omini就会生成对应的视频效果。

二、Gemini 3.5系列来了，Flash版性能拉满，Pro下月发

谷歌还推出了Gemini 3.5系列首款模型Gemini 3.5 Flash，擅长复杂且具备实际实用价值的长期任务。皮查伊透露，他们内部显示Gemini 3.5 Pro的体验效果很好，下个月会发布。

Arena AI的评测结果显示，Gemini 3.5 Flash在性能、速度、成本等方面已经全面超越Gemini 3 Flash和Gemini 3.1 Pro。

目前，Gemini 3.5 Flash已经在Gemini App、谷歌搜索的AI Mode中集成。

从基准测试来看，Gemini 3.5 Flash在多个维度上可提供媲美旗舰模型的性能，在Terminal-Bench 2.1（76.2%）、GDPval-AA（1656 Elo）和 MCP Atlas（83.6%）等具有挑战性的编码和代理基准测试上，表现优于Gemini 3.1 Pro，并在多模态理解方面领先。在每秒输出token数方面，是其他前沿模型的4倍。

谷歌一直在使用Gemini 3.5 Flash，配合开发平台Antigravity的模型，皮查伊将这一新模型称作谷歌内部游戏规则的改变，这大大加快了我们的构建速度。

▲Gemini 3.5 Flash结合Antigravity可以根据动态标准自动重命名文件和分类他举例称，如果公司能混合使用Gemini 3.5 Flash和其他前沿模型，可以节省大量资金，公司每天处理约1万亿token，如果他们将80%的工作负载从其他前沿模型转移到3.5 Flash上，每年将节省超过10亿美元。

具体功能上，Gemini 3.5 Flash能快速规划、构建和迭代，帮用户完成开发新应用、维护代码库、协助准备财务文件等任务。

三、2款AI眼镜上新，不掏手机就能发短信、听导航、拍照

谷歌AI眼镜全新升级，其发布了联合眼镜品牌Gentle Monster和Warby Parker的2款新AI眼镜，还增加了获取导航、发送短信、拍照等功能，且全程无需用户掏出手机。

AI眼镜软件方面的更新包括：

询问看到的内容：用户佩戴谷歌AI眼镜时，可以询问Gemini眼前看到的景象，如查找路过餐厅的评价、快速解读交通标识等。

导航：AI眼镜会知道用户站在哪里、面向哪个方向，然后给出自然的、更符合当下情况的导航路线。Gemini还能根据用户的喜好添加停靠点或附近餐厅。

免提通话：用户无需触碰手机，就能接听管理通话、发送消息，还可让Gemini汇总未读信息，也能点播贴合当下氛围的音乐。

拍照修图：用户只需一句语音指令，即可完成拍摄，还能借助Nano Banana模型剔除画面多余杂物，或是进行快速修图。

翻译：AI眼镜支持实时语音翻译，并且发音语气、音调都贴合说话人原声，也可直接识别菜单、标牌上的文字，一键收听译文读音。

智能代办：Gemini可在后台自动处理多步骤任务，无需掏出手机，它就能帮你在外卖平台下单咖啡，用户只需最后确认订单即可。

与手机应用灵动：用户可以仅凭语音操作手机软件，例如呼叫Uber、学习外语等，并且这款AI眼镜同时适配安卓与苹果手机。

四、全新AI搜索框上线，自动帮你梳理提问思路

谷歌搜索迎来了25年来最大升级，其推出了全新的智能AI搜索框。今日，其宣布将Gemini 3.5 Flash作为谷歌搜索AI Mode的默认模型。

主题：谷歌|智东西|谷歌搜索