Google发布Gemma 412 B开源模型:主打无编码器全模态，16 GB内存笔记本可本地运行

2026-06-04 09:19

Google日前正式发布全新开源大模型Gemma412B，标志着端侧全模态AI迎来突破性进展。该模型颠覆了传统多模态模型依赖视觉和音频外部编码器的复杂链路，创新性地采用“Unified”无编码器架构。

通过这一设计，文字、图像、音频及视频四种模态的原始数据得以直接输入同一个Transformer主干网络进行一体化处理，从根本上消除了因传统外挂“翻译”模块带来的显存占用与高延迟问题，实现了更接近原生的跨模态理解。

作为一款专为消费级硬件优化的端侧模型，Gemma412B在参数效率上表现惊人。在基准测试中，其跑分成绩直逼Google自家26B体量的大模型，而内存占用却不足其一半。模型具备256K Token的超长上下文窗口，支持超过140种语言，并内置强化逐步推理的Thinking模式与原生Function Calling能力。

在落地部署方面，该模型最低仅需16GB显存或统一内存即可流畅运行，经4-bit量化后更是可下探至8GB，其核心目标直指在普通笔记本上实现高效本地化运行。目前，Google AI Edge Gallery已正式从手机端扩展至桌面端，macOS用户下载安装即可本地激活Gemma412B。得益于内置的沙盒Python环境以及支持语音交互的Eloquent系统，用户已能在聊天界面中直接执行代码、绘制图表并进行流畅的语音对齐交互。

业内分析认为，Gemma412B的推出进一步加速了AI去中心化的进程。其极高的性能密度与端侧亲和力，不仅打破了云端算力的桎梏，也为未来兼顾低延迟与隐私安全的端侧全模态个人助理应用铺平了技术道路。

主题：Gemma412B