Gemma4
描述
Gemma4是GoogleDeepMind构建的最新开放模型系列,它们是多模态模型,用于处理文本和图片输入(小型模型支持音频输入)以及生成文本输出。
文章
Gemma4此前传闻除了之前的小参数量模型之外,还会增加一个120B参数的新模型,是上代的4倍规模,但会采用MoE架构,激活参数15B,可以降低要求,依然能本地离线运行。
文章
分类
重建
系列
本周四晚,谷歌开源了当前开源世界最强的模型家族Gemma4系列。
文章
模型
Gemma4模型可处理文本、视觉和音频方面的各种任务。
文章
Gemma4模型提供4种参数大小:E2B、E4B、31B和26BA4B。
文章
Gemma4模型旨在在各种规模下提供前沿性能,目标部署场景涵盖移动设备和边缘设备(E2B、E4B)到消费类GPU和工作站(26BA4B、31B)。
文章
下表详细列出了使用各种大小的Gemma4模型版本运行推理所需的大致GPU或TPU内存。
文章
加载Gemma4模型所需的大致GPU或TPU内存,具体取决于参数数量和量化级别。
文章
谷歌展示了一些Gemma4的模型能力,比如测试它检测和指向GUI元素的能力:「图像中查看配方元素的边界框是什么?
文章
引入
原生系统提示支持-Gemma4引入了对system角色的原生支持,从而实现更结构化和可控的对话。
文章
总的来说,Gemma4引入的功能和架构改进包括:
文章
大模型
最让人关心的还是Gemma4大模型的能力,当前的Gemma3算是轻量级的,最大参数量也就27B,可以用单卡GPU运行,也支持多模态能力,能力当然没法跟谷歌主力大模型相比,但在开源社区口碑还是不错的。
文章
谷歌发布Gemma4大模型:31B登顶开源第三!
文章
效果
Gemma4此前传闻除了之前的小参数量模型之外,还会增加一个120B参数的新模型,是上代的4倍规模,但会采用MoE架构,激活参数15B,可以降低要求,依然能本地离线运行。
文章
影响
谷歌展示了一些Gemma4的模型能力,比如测试它检测和指向GUI元素的能力:「图像中查看配方元素的边界框是什么?
文章