谷歌Gemini Omni全能模型发布:可从任意输入生成任意输出,一句话让AI修改视频
IT之家 5 月 20 日消息,在今日的 2026 谷歌 I/O 开发者大会上,谷歌正式发布了 Gemini Omni 模型。
诺贝尔物理学奖获得者、Google DeepMind 负责人哈萨比斯(Demis Hassabis)表示,Gemini Omni 是 Gemini 模型家族迄今为止能力最为全面的版本。 “Omni”意指“全能” ,该模型在处理文字、图像、视频、音频等多种模态信息时,展示出前所未有的流畅性与深度。
Gemini Omni 宣称能“ 从任何输入生成任何输出 ”,支持对话式编辑,用户可一句话改变视频中的角色、背景等元素。
IT之家从大会获悉,谷歌还宣布推出 Gemini Omni 家族首款模型 Gemini Omni Flash ,即日起可在 Gemini App、Google Flow、YouTube Shorts 可用,未来将推 API 服务。
2026 谷歌 I/O 开发者大会
谷歌 Google AI 开发者大会 it之家



新浪科技公众号
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

“不好看就退票”服务,能救电影院吗?
微信封禁自家“兄弟”红包,打的什么牌?
华住,比携程还会捞金?
00 后校友向母校捐赠 20 亿 Token 被学校热捧:网友质疑仅价值几百元,回应称不在乎值多少钱
百度地图宣布接入国家级数据:恶劣天气提前预警 化身AI智能副驾
SpaceX将发射史上最高推力最大火箭
从拿到最低价格转向尽可能锁定供应:苹果也开始向跪求内存厂商了
消息称英特尔 Nova Lake 处理器 ES 样品已出货,预计单核性能提升 20% 多核翻倍
持续划伤肠道推高癌症复发 很多人可能每天都在吃“塑料刀片”
Anthropic 收购 Stainless,谷歌和 OpenAI 失去关键 AI SDK 工具
我国首个二氧化碳地热能项目在郑州投产,取热能力可提升约 20%
张雪峰42岁冥诞 女儿张姩菡发文:爸爸 我很想你
苹果折叠屏iPhone遇到了最大难题:铰链可靠性成拦路虎
主题:谷歌