谷歌Gemini Omni全能模型发布：可从任意输入生成任意输出，一句话让AI修改视频

速读：在今日的 2026 谷歌 I/O 开发者大会上，谷歌正式发布了 Gemini Omni 模型。 GeminiOmni宣称能“从任何输入生成任何输出”，支持对话式编辑，用户可一句话改变视频中的角色、背景等元素。

2026年05月20日 01:26

IT之家 5 月 20 日消息，在今日的 2026 谷歌 I/O 开发者大会上，谷歌正式发布了 Gemini Omni 模型。

诺贝尔物理学奖获得者、Google DeepMind 负责人哈萨比斯（Demis Hassabis）表示，Gemini Omni 是 Gemini 模型家族迄今为止能力最为全面的版本。 “Omni”意指“全能” ，该模型在处理文字、图像、视频、音频等多种模态信息时，展示出前所未有的流畅性与深度。

Gemini Omni 宣称能“ 从任何输入生成任何输出 ”，支持对话式编辑，用户可一句话改变视频中的角色、背景等元素。

IT之家从大会获悉，谷歌还宣布推出 Gemini Omni 家族首款模型 Gemini Omni Flash ，即日起可在 Gemini App、Google Flow、YouTube Shorts 可用，未来将推 API 服务。

2026 谷歌 I/O 开发者大会专题 2026 谷歌 I/O 开发者大会

谷歌 Google AI 开发者大会 it之家

新浪众测

新浪科技公众号

“掌”握科技鲜闻（微信搜索techsina或扫描左侧二维码关注）

“不好看就退票”服务，能救电影院吗？

微信封禁自家“兄弟”红包，打的什么牌？

华住，比携程还会捞金？

00 后校友向母校捐赠 20 亿 Token 被学校热捧：网友质疑仅价值几百元，回应称不在乎值多少钱

百度地图宣布接入国家级数据：恶劣天气提前预警化身AI智能副驾

SpaceX将发射史上最高推力最大火箭

从拿到最低价格转向尽可能锁定供应：苹果也开始向跪求内存厂商了

消息称英特尔 Nova Lake 处理器 ES 样品已出货，预计单核性能提升 20% 多核翻倍

持续划伤肠道推高癌症复发很多人可能每天都在吃“塑料刀片”

Anthropic 收购 Stainless，谷歌和 OpenAI 失去关键 AI SDK 工具

我国首个二氧化碳地热能项目在郑州投产，取热能力可提升约 20%

张雪峰42岁冥诞女儿张姩菡发文：爸爸我很想你

苹果折叠屏iPhone遇到了最大难题：铰链可靠性成拦路虎

主题：谷歌