登录

谷歌AI全家桶深夜爆更:Gemini 3.5新王登场,数十亿人搜索变天,AI眼镜终于来了


速读:智东西5月20日报道,今日凌晨,在一年一度的谷歌I/O开发者大会上,谷歌接连甩出2款新模型、谷歌搜索25年最大升级、ClaudeCode谷歌版开发平台Antigravity2.0、AI眼镜等多个大招! 首先用户可以通过对话进行视频剪辑,例如重塑视频中的环境,通过微调细节或者以现有视频为蓝本,打造出用气泡做雕塑等现实情况无法实现的视频内容。 最后,其能将用户输入的图像、文本、视频、音频等任意参考内容,生成一个统一的视频。 目前,Gemini3.5Flash已经在GeminiApp、谷歌搜索的AIMode中集成。
2026年05月20日 07:44

  炒股就看 金麒麟分析师研报 ,权威,专业,及时,全面,助您挖掘潜力主题机会!

(来源:智东西)

智东西

作者 程茜 陈佳

编辑 云鹏

智东西5月20日报道,今日凌晨,在一年一度的谷歌I/O开发者大会上,谷歌接连甩出 2款新模型、谷歌搜索25年最大升级、Claude Code谷歌版开发平台Antigravity 2.0、AI眼镜 等多个大招!

谷歌CEO桑达尔·皮查伊(Sundar Pichai)称,这次谷歌I/O大会的新发布,意味着其已正式迈入 智能体驱动的Gemini时代 。皮查伊一开场就放出了自己形象生成的AI视频,暗戳戳秀了一波自家AI能力。

1、新发2款大模型 :可基于任意输入形式、生成各类模态输出内容的全能模型Gemini Omini,其首款模型 Gemini Omni Flash 将率先支持视频输出;谷歌最新、最强旗舰模型 Gemini 3.5 Flash 亮相,每秒输出token数是OpenAI、Anthropic模型的 4倍 。

2、开发平台Google Antigravity升级 :谷歌基于Gemini 3.5 Flash升级了Google Antigravity、Gemini App上的全天候个人智能体Gemini Spark、谷歌搜索,其宣布此次是 谷歌搜索25年来最大更新 。

3、谷歌官宣AI眼镜新进展 :联合三星展示了由眼镜品牌Gentle Monster和Warby Parker共同设计的 两款新眼镜 。谷歌纯音频AI眼镜将在今年晚些时候率先推出,带显示屏的版本将在明年推出。

4、其他大招 :Gemini App中的日报智能体Daily Brief、购物中心智能体Universal Cart、 AI图像创建和编辑工具Google Pics、Google Flow智能体等。

发布会开场,皮查伊官宣了几组数据:一年时间,谷歌旗下各类业务平台每月处理token暴涨7倍,突破 3200万亿token 。目前每月有超过 850万开发者 利用谷歌的模型开发新应用和新体验,模型API目前每分钟处理大约 190亿token ,过去12个月有超过375名谷歌云客户各自处理了超过 一万亿token 。

产品的用户量方面,如今谷歌有13款产品的用户超过10亿,其中5款用户超过 30亿 ;AI Overviews现在拥有超过 25亿 月活跃用户,仅一年时间,谷歌搜索AI Mode的月活跃用户就已突破 10亿 ;Gemini应用的月活跃用户已突破 9亿 ,每日请求增长了七倍以上;Nano Banana图像生成模型已生成超过 500亿张 图像。

在资本支出上,谷歌今年的资本支出将达到2022年的约6倍,约为 1800亿至1900亿美元 (约合人民币1.2万亿至1.3万亿元),这项投资的关键部分就是谷歌TPU。谷歌还特地为TPU制作了动画短片。

本届谷歌I/O大会依旧信息量爆棚,智东西带你一文看尽。

一、全能模型Omni亮相,自然语言对话就能改视频

谷歌推出全新模型系列Gemini Omni,可依托任意输入内容生成各类内容,目前其率先支持视频输出,未来会支持图像、文本输出。

谷歌Omni家族的首款模型是Gemini Omni Flash,用户可以在Gemini应用、Google Flow和YouTube Shorts上试用。谷歌将在未来几周通过API向开发者和企业客户推广。

首先用户可以通过对话进行视频剪辑,例如重塑视频中的环境,通过微调细节或者以现有视频为蓝本,打造出用气泡做雕塑等现实情况无法实现的视频内容。

Omini还能对视频中的动作、物品进行修改。谷歌DeepMind CEO戴密斯·哈萨比斯(Demis Hassabis)在现场演示了Omini的效果,其修改提示词为:全程保留原视频所有画面与叙事,仅在4.3秒男子手指触碰镜面的瞬间触发特效:镜面以指尖为圆心,泛起液态水波纹般的涟漪;房间整体环境瞬间暗化;海量可自主变形、具备照片级真实质感的多几何造型3D棱镜,同时布满整个房间空间。

其次,Omni还能结合世界知识推演视频的后续情节走向,例如其能理解重力、流体力学等物理概念,创造出弹珠快速滚动的流畅镜头。

此外,其还能通过简短的提示,生成更为复杂的内容,例如用黏土动画解说蛋白质折叠的概念。

最后,其能将用户输入的图像、文本、视频、音频等任意参考内容,生成一个统一的视频。不过目前其只支持语音类参考素材,后续很快会上线其他类型音频输入能力。例如当用户上传角色、场景、音频素材,Omini就会生成对应的视频效果。

二、Gemini 3.5系列来了,Flash版性能拉满,Pro下月发

谷歌还推出了Gemini 3.5系列首款模型Gemini 3.5 Flash,擅长复杂且具备实际实用价值的长期任务。皮查伊透露,他们内部显示Gemini 3.5 Pro的体验效果很好,下个月会发布。

Arena AI的评测结果显示,Gemini 3.5 Flash在性能、速度、成本等方面已经全面超越Gemini 3 Flash和Gemini 3.1 Pro。

目前,Gemini 3.5 Flash已经在Gemini App、谷歌搜索的AI Mode中集成。

从基准测试来看,Gemini 3.5 Flash在多个维度上可提供媲美旗舰模型的性能,在Terminal-Bench 2.1(76.2%)、GDPval-AA(1656 Elo)和 MCP Atlas(83.6%)等具有挑战性的编码和代理基准测试上,表现优于Gemini 3.1 Pro,并在多模态理解方面领先。在每秒输出token数方面,是其他前沿模型的4倍。

谷歌一直在使用Gemini 3.5 Flash,配合开发平台Antigravity的模型,皮查伊将这一新模型称作谷歌内部游戏规则的改变,这大大加快了我们的构建速度。

▲Gemini 3.5 Flash结合Antigravity可以根据动态标准自动重命名文件和分类 ▲Gemini 3.5 Flash结合Antigravity可以根据动态标准自动重命名文件和分类 他举例称,如果公司能混合使用Gemini 3.5 Flash和其他前沿模型,可以节省大量资金,公司每天处理约1万亿token,如果他们将80%的工作负载从其他前沿模型转移到3.5 Flash上,每年将节省超过10亿美元。

具体功能上,Gemini 3.5 Flash能快速规划、构建和迭代,帮用户完成开发新应用、维护代码库、协助准备财务文件等任务。

三、2款AI眼镜上新,不掏手机就能发短信、听导航、拍照

谷歌AI眼镜全新升级,其发布了联合眼镜品牌Gentle Monster和Warby Parker的2款新AI眼镜,还增加了获取导航、发送短信、拍照等功能,且全程无需用户掏出手机。

AI眼镜软件方面的更新包括:

询问看到的内容:用户佩戴谷歌AI眼镜时,可以询问Gemini眼前看到的景象,如查找路过餐厅的评价、快速解读交通标识等。

导航:AI眼镜会知道用户站在哪里、面向哪个方向,然后给出自然的、更符合当下情况的导航路线。Gemini还能根据用户的喜好添加停靠点或附近餐厅。

免提通话:用户无需触碰手机,就能接听管理通话、发送消息,还可让Gemini汇总未读信息,也能点播贴合当下氛围的音乐。

拍照修图:用户只需一句语音指令,即可完成拍摄,还能借助Nano Banana模型剔除画面多余杂物,或是进行快速修图。

翻译:AI眼镜支持实时语音翻译,并且发音语气、音调都贴合说话人原声,也可直接识别菜单、标牌上的文字,一键收听译文读音。

智能代办:Gemini可在后台自动处理多步骤任务,无需掏出手机,它就能帮你在外卖平台下单咖啡,用户只需最后确认订单即可。

与手机应用灵动:用户可以仅凭语音操作手机软件,例如呼叫Uber、学习外语等,并且这款AI眼镜同时适配安卓与苹果手机。

四、全新AI搜索框上线,自动帮你梳理提问思路

谷歌搜索迎来了25年来最大升级,其推出了全新的智能AI搜索框。今日,其宣布将Gemini 3.5 Flash作为谷歌搜索AI Mode的默认模型。

主题:谷歌|智东西|谷歌搜索