登录

谷歌Gemini Omni全能模型发布:可从任意输入生成任意输出,一句话让AI修改视频


速读:在今日的 2026 谷歌 I/O 开发者大会上,谷歌正式发布了 Gemini Omni 模型。 GeminiOmni宣称能“从任何输入生成任何输出”,支持对话式编辑,用户可一句话改变视频中的角色、背景等元素。
2026年05月20日 01:26

IT之家 5 月 20 日消息,在今日的 2026 谷歌 I/O 开发者大会上,谷歌正式发布了 Gemini Omni 模型。

诺贝尔物理学奖获得者、Google DeepMind 负责人哈萨比斯(Demis Hassabis)表示,Gemini Omni 是 Gemini 模型家族迄今为止能力最为全面的版本。 “Omni”意指“全能” ,该模型在处理文字、图像、视频、音频等多种模态信息时,展示出前所未有的流畅性与深度。

Gemini Omni 宣称能“ 从任何输入生成任何输出 ”,支持对话式编辑,用户可一句话改变视频中的角色、背景等元素。

IT之家从大会获悉,谷歌还宣布推出 Gemini Omni 家族首款模型 Gemini Omni Flash ,即日起可在 Gemini App、Google Flow、YouTube Shorts 可用,未来将推 API 服务。

2026 谷歌 I/O 开发者大会专题 2026 谷歌 I/O 开发者大会

谷歌 Google AI 开发者大会 it之家

新浪众测

新浪众测

新浪科技公众号

新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

“不好看就退票”服务,能救电影院吗?

微信封禁自家“兄弟”红包,打的什么牌?

华住,比携程还会捞金?

00 后校友向母校捐赠 20 亿 Token 被学校热捧:网友质疑仅价值几百元,回应称不在乎值多少钱

百度地图宣布接入国家级数据:恶劣天气提前预警 化身AI智能副驾

SpaceX将发射史上最高推力最大火箭

从拿到最低价格转向尽可能锁定供应:苹果也开始向跪求内存厂商了

消息称英特尔 Nova Lake 处理器 ES 样品已出货,预计单核性能提升 20% 多核翻倍

持续划伤肠道推高癌症复发 很多人可能每天都在吃“塑料刀片”

Anthropic 收购 Stainless,谷歌和 OpenAI 失去关键 AI SDK 工具

我国首个二氧化碳地热能项目在郑州投产,取热能力可提升约 20%

张雪峰42岁冥诞 女儿张姩菡发文:爸爸 我很想你

苹果折叠屏iPhone遇到了最大难题:铰链可靠性成拦路虎

主题:谷歌