谷歌发布了其最先进的开放权重人工智能模型家族Gemma 4,这标志着开放权重AI模型领域的重大进步。
技术架构与性能突破
Gemma 4基于与Gemini 3相同的架构基础构建,专门设计用于处理复杂推理任务,并支持在工作站和智能手机等低功耗设备上本地运行的自主AI智能体。
谷歌DeepMind研究人员Clement Farabet和Olivier Lacombe表示,他们成功实现了更高的"每参数智能度",使模型能够发挥远超其规模的性能。例如,31B Dense变体目前在行业标准Arena AI Text排行榜的开放模型中排名第三。
四种模型变体满足不同需求
Gemma 4提供四种不同版本:Effective 2B、Effective 4B、26B专家混合模型和31B Dense模型。较小的"Effective"模型专为Android智能手机或树莓派计算机等轻量级硬件的边缘使用场景而设计。
26B MoE模型采用了巧妙的设计,在推理任务中仅激活38亿个参数,既能保持高速运行,又不会牺牲大型模型的深度知识库优势。
智能体支持与多模态能力
与早期的Gemma版本不同,Gemma 4模型原生支持函数调用和结构化JSON输出,开发者无需调整设计即可让模型与其他软件工具交互。这使得开发者能够利用这些模型构建能够与第三方工具交互并执行多步骤计划的自主智能体。
所有四个模型都具备处理图像和视频的能力,较小的E2B和E4B变体还进一步支持原生音频输入,能够直接在设备上实现实时语音理解。谷歌还增加了模型的上下文窗口,最小模型可达128K,较大的两个模型可达256K。这意味着开发者能够通过单个提示上传整个代码库或大量文档集合。
开放许可与部署方式
每个模型都采用宽松的Apache 2.0许可证发布,消除了其他AI模型的许多商业限制,使其成为构建企业应用程序开发者的绝佳选择。这些模型可以通过Google Cloud直接访问,也可以在Hugging Face、Kaggle和Ollama上获取开放权重版本。
市场影响与前景展望
这次发布凸显了谷歌主导"本地AI"行业的雄心。Constellation Research分析师Holger Mueller表示,由于即使是较大的Gemma 4模型也足够小,可以在单个图形处理单元上运行,这使得它们适用于对低延迟和数字主权要求较高的边缘使用场景和应用。
Mueller评论道:"谷歌不仅通过推进Gemini,还通过Gemma 4系列的开放模型来构建其在AI领域的领先地位。这些模型对于构建AI开发者生态系统非常重要,将帮助公司在不同设备形态上挖掘功能性和垂直使用场景。谷歌此前的Gemma 3发布已经设定了很高的标准,因此人们对这次发布寄予厚望。"
Q&A
Q1:Gemma 4模型有什么特殊之处?
A:Gemma 4是谷歌最先进的开放权重AI模型家族,基于与Gemini 3相同的架构,专门设计用于处理复杂推理任务。它能够在工作站和智能手机等低功耗设备上本地运行自主AI智能体,实现了更高的"每参数智能度",性能远超其模型规模。
Q2:Gemma 4有哪些不同版本可以选择?
A:Gemma 4提供四种版本:Effective 2B和Effective 4B专为智能手机、树莓派等轻量级硬件设计;26B专家混合模型在推理时仅激活38亿参数,兼顾速度和性能;31B Dense模型在开放模型排行榜中排名第三,性能强劲。
Q3:Gemma 4在商业应用方面有什么优势?
A:Gemma 4采用宽松的Apache 2.0许可证,消除了许多商业限制,特别适合企业应用开发。模型原生支持函数调用和JSON输出,可直接构建自主智能体。同时支持图像、视频和音频处理,上下文窗口最大可达256K,能处理大型文档和代码库。
好文章,需要你的鼓励
火箭实验室(Rocket Lab)宣布计划以现金加股票方式,斥资80亿美元收购主要卫星运营商铱星通信(Iridium Communications),交易预计于2027年中完成。铱星目前运营着由66颗活跃低轨卫星组成的星座网络,拥有约255万活跃用户,2024年营收达8.717亿美元。收购完成后,Rocket Lab计划借助其新型重型运载火箭Neutron及Lightning卫星平台,扩大铱星星座规模,开拓未被覆盖的市场并降低发射成本。
腾讯等机构提出ViQ框架,通过两阶段渐进量化训练,让离散视觉编码在多模态理解和图像重建上同时追平连续特征编码器,训练速度最高提升70%。
音乐流媒体平台Tidal宣布,将于7月中旬启用自动化工具,对完全由AI生成的音乐添加"AI"标识,并移除具有欺诈性质的曲目。平台还将取消AI生成音乐的版税资格,仅向真人创作、演唱的原创音乐开放变现渠道。此外,Tidal明确将高频异常上传、干扰真实艺术家等行为列为欺诈活动。Deezer、Spotify等竞争对手此前已推出类似检测机制,流媒体行业正加速构建AI内容治理体系。
香港科技大学与华为联合提出LISA训练方法,通过让副网络对齐"似然分数",将ControlNet等图像生成模型的训练收敛速度提升逾2.78倍,同时改善图像质量与条件控制精度。