谷歌发布Gemma 4模型，为低功耗设备带来复杂推理能力

谷歌发布最先进开放权重AI模型Gemma 4，基于Gemini 3架构，专为复杂推理任务和本地自主AI代理设计。该系列包含四个版本，从2B到31B参数不等，可在智能手机、工作站等低功耗设备上运行。模型支持原生函数调用、图像视频处理和音频输入，上下文窗口扩展至256K，采用Apache 2.0许可证，可通过谷歌云等平台获取。

谷歌发布了其最先进的开放权重人工智能模型家族Gemma 4，这标志着开放权重AI模型领域的重大进步。

技术架构与性能突破

Gemma 4基于与Gemini 3相同的架构基础构建，专门设计用于处理复杂推理任务，并支持在工作站和智能手机等低功耗设备上本地运行的自主AI智能体。

谷歌DeepMind研究人员Clement Farabet和Olivier Lacombe表示，他们成功实现了更高的"每参数智能度"，使模型能够发挥远超其规模的性能。例如，31B Dense变体目前在行业标准Arena AI Text排行榜的开放模型中排名第三。

四种模型变体满足不同需求

Gemma 4提供四种不同版本：Effective 2B、Effective 4B、26B专家混合模型和31B Dense模型。较小的"Effective"模型专为Android智能手机或树莓派计算机等轻量级硬件的边缘使用场景而设计。

26B MoE模型采用了巧妙的设计，在推理任务中仅激活38亿个参数，既能保持高速运行，又不会牺牲大型模型的深度知识库优势。

智能体支持与多模态能力

与早期的Gemma版本不同，Gemma 4模型原生支持函数调用和结构化JSON输出，开发者无需调整设计即可让模型与其他软件工具交互。这使得开发者能够利用这些模型构建能够与第三方工具交互并执行多步骤计划的自主智能体。

所有四个模型都具备处理图像和视频的能力，较小的E2B和E4B变体还进一步支持原生音频输入，能够直接在设备上实现实时语音理解。谷歌还增加了模型的上下文窗口，最小模型可达128K，较大的两个模型可达256K。这意味着开发者能够通过单个提示上传整个代码库或大量文档集合。

开放许可与部署方式

每个模型都采用宽松的Apache 2.0许可证发布，消除了其他AI模型的许多商业限制，使其成为构建企业应用程序开发者的绝佳选择。这些模型可以通过Google Cloud直接访问，也可以在Hugging Face、Kaggle和Ollama上获取开放权重版本。

市场影响与前景展望

这次发布凸显了谷歌主导"本地AI"行业的雄心。Constellation Research分析师Holger Mueller表示，由于即使是较大的Gemma 4模型也足够小，可以在单个图形处理单元上运行，这使得它们适用于对低延迟和数字主权要求较高的边缘使用场景和应用。

Mueller评论道："谷歌不仅通过推进Gemini，还通过Gemma 4系列的开放模型来构建其在AI领域的领先地位。这些模型对于构建AI开发者生态系统非常重要，将帮助公司在不同设备形态上挖掘功能性和垂直使用场景。谷歌此前的Gemma 3发布已经设定了很高的标准，因此人们对这次发布寄予厚望。"

Q&A

Q1：Gemma 4模型有什么特殊之处？

A：Gemma 4是谷歌最先进的开放权重AI模型家族，基于与Gemini 3相同的架构，专门设计用于处理复杂推理任务。它能够在工作站和智能手机等低功耗设备上本地运行自主AI智能体，实现了更高的"每参数智能度"，性能远超其模型规模。

Q2：Gemma 4有哪些不同版本可以选择？

A：Gemma 4提供四种版本：Effective 2B和Effective 4B专为智能手机、树莓派等轻量级硬件设计；26B专家混合模型在推理时仅激活38亿参数，兼顾速度和性能；31B Dense模型在开放模型排行榜中排名第三，性能强劲。

Q3：Gemma 4在商业应用方面有什么优势？

A：Gemma 4采用宽松的Apache 2.0许可证，消除了许多商业限制，特别适合企业应用开发。模型原生支持函数调用和JSON输出，可直接构建自主智能体。同时支持图像、视频和音频处理，上下文窗口最大可达256K，能处理大型文档和代码库。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

谷歌发布Gemma 4模型，为低功耗设备带来复杂推理能力

来源：SiliconANGLE

2026

04/03

13:46

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

Artemis II宇航员在太空中遭遇Outlook故障问题

微软承认Copilot不应被用于重要事务处理

Anthropic打击泄露代码误伤GitHub正当存储库

谷歌发布Gemma 4开源AI模型，转向Apache 2.0许可证

Google Home升级Gemini语音理解能力

微软推出新转录模型 迈向商业化"超级智能"愿景

微软发布三款新AI模型，超越传统文本处理边界

Alexa Plus AI推出餐饮配送服务，支持Uber Eats和Grubhub点餐

谷歌发布Gemma 4开源模型系列，基于Gemini 3技术打造

英联邦聚变系统公司借助磁体技术创收

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会

微软推出新转录模型迈向商业化"超级智能"愿景