Gemma4

Gemma4是GoogleDeepMind构建的最新开放模型系列，它们是多模态模型，用于处理文本和图片输入（小型模型支持音频输入）以及生成文本输出。

文章

Gemma4此前传闻除了之前的小参数量模型之外，还会增加一个120B参数的新模型，是上代的4倍规模，但会采用MoE架构，激活参数15B，可以降低要求，依然能本地离线运行。

文章

Gemma4重建的页面：

文章

本周四晚，谷歌开源了当前开源世界最强的模型家族Gemma4系列。

文章

Gemma4模型可处理文本、视觉和音频方面的各种任务。

文章

Gemma4模型提供4种参数大小：E2B、E4B、31B和26BA4B。

文章

Gemma4模型旨在在各种规模下提供前沿性能，目标部署场景涵盖移动设备和边缘设备(E2B、E4B)到消费类GPU和工作站(26BA4B、31B)。

文章

下表详细列出了使用各种大小的Gemma4模型版本运行推理所需的大致GPU或TPU内存。

文章

加载Gemma4模型所需的大致GPU或TPU内存，具体取决于参数数量和量化级别。

文章

谷歌展示了一些Gemma4的模型能力，比如测试它检测和指向GUI元素的能力：「图像中查看配方元素的边界框是什么？

文章

原生系统提示支持-Gemma4引入了对system角色的原生支持，从而实现更结构化和可控的对话。

文章

总的来说，Gemma4引入的功能和架构改进包括：

文章

最让人关心的还是Gemma4大模型的能力，当前的Gemma3算是轻量级的，最大参数量也就27B，可以用单卡GPU运行，也支持多模态能力，能力当然没法跟谷歌主力大模型相比，但在开源社区口碑还是不错的。

文章

谷歌发布Gemma4大模型：31B登顶开源第三！

文章

Gemma4此前传闻除了之前的小参数量模型之外，还会增加一个120B参数的新模型，是上代的4倍规模，但会采用MoE架构，激活参数15B，可以降低要求，依然能本地离线运行。

文章

谷歌展示了一些Gemma4的模型能力，比如测试它检测和指向GUI元素的能力：「图像中查看配方元素的边界框是什么？

文章