Meta发布Llama 4，新一代旗舰AI模型

Meta发布了Llama家族的新一代AI模型Llama 4，包括Scout、Maverick和Behemoth三个模型。这些模型在大量未标记的文本、图像和视频数据上进行训练，具备广泛的视觉理解能力。Llama 4采用混合专家架构，提高了计算效率。Meta表示，这标志着Llama生态系统新时代的开始，将为用户带来更强大的AI能力。

Meta发布了Llama系列的新一代AI模型集合Llama 4——而且选在了周六这一天。

这次共发布了四个新模型：Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth。Meta表示，所有模型都经过了"大量无标签文本、图像和视频数据"的训练，使它们具备"广泛的视觉理解能力"。

据报道，中国AI实验室DeepSeek开源模型的成功（其性能与Meta之前的旗舰Llama模型相当甚至更优）促使Llama开发进入加速模式。据说Meta组建了紧急工作组，以破解DeepSeek如何降低R1和V3等模型的运行和部署成本。

Scout和Maverick已在Llama.com和Meta合作伙伴（包括AI开发平台Hugging Face）上公开提供，而Behemoth仍在训练中。Meta表示，其AI助手Meta AI已在40个国家的WhatsApp、Messenger和Instagram等应用中更新为使用Llama 4。多模态功能目前仅限美国地区使用英语。

一些开发者可能会对Llama 4的许可条款有异议。

"居住"或"主要营业地"在欧盟的用户和公司被禁止使用或分发这些模型，这可能是由于该地区AI和数据隐私法律施加的治理要求所致（Meta过去曾抨击这些法律过于繁重）。此外，与之前的Llama版本一样，月活跃用户超过7亿的公司必须向Meta申请特殊许可，而Meta可自行决定是否授予。

"这些Llama 4模型标志着Llama生态系统新时代的开始，"Meta在博客文章中写道。"这仅仅是Llama 4系列的开始。"

Meta表示，Llama 4是该公司首批使用混合专家（MoE）架构的模型系列，这种架构在训练和回答查询方面更具计算效率。MoE架构基本上将数据处理任务分解为子任务，然后将它们分配给较小的、专业化的"专家"模型。

例如，Maverick拥有4000亿总参数，但在128个"专家"中只有170亿活跃参数（参数大致对应于模型的问题解决能力）。Scout有170亿活跃参数、16位专家和1090亿总参数。

根据Meta的内部测试，Maverick（该公司表示最适合"通用助手和聊天"用例，如创意写作）在某些编码、推理、多语言、长上下文和图像基准测试上超过了OpenAI的GPT-4o和Google的Gemini 2.0等模型。然而，Maverick在能力上尚不及Google的Gemini 2.5 Pro、Anthropic的Claude 3.7 Sonnet和OpenAI的GPT-4.5等更强大的最新模型。

Scout的优势在于文档摘要和大型代码库推理等任务。其独特之处在于拥有非常大的上下文窗口：1000万个token（"token"代表原始文本的片段，例如"fantastic"被分割为"fan"、"tas"和"tic"）。简单来说，Scout可以处理图像和多达数百万字的文本，使其能够处理和使用极长的文档。

根据Meta的计算，Scout可以在单个Nvidia H100 GPU上运行，而Maverick需要Nvidia H100 DGX系统或同等设备。

Meta尚未发布的Behemoth将需要更强大的硬件。据该公司介绍，Behemoth拥有2880亿活跃参数、16位专家和近2万亿总参数。Meta的内部基准测试显示，Behemoth在衡量数学问题解决等STEM技能的多项评估中优于GPT-4.5、Claude 3.7 Sonnet和Gemini 2.0 Pro（但不及2.5 Pro）。

值得注意的是，Llama 4模型系列中没有一个是类似OpenAI的o1和o3-mini那样的真正"推理"模型。推理模型会对其回答进行事实检查，通常对问题的回应更可靠，但因此比传统的"非推理"模型需要更长时间来提供答案。

有趣的是，Meta表示它调整了所有Llama 4模型，使其拒绝回答"有争议"问题的频率降低。据该公司称，Llama 4会回应之前Llama模型不会回答的"有争议的"政治和社会话题。此外，该公司表示，Llama 4在处理它完全不会回应的提示方面"平衡性大大提高"。

"你可以依靠[Llama 4]提供有帮助、基于事实且不带判断的回应，"Meta发言人告诉TechCrunch。"我们继续让Llama更具响应性，使其能够回答更多问题，能够回应各种不同的观点[...]，不偏向某些观点。"

这些调整正值一些白宫盟友指责AI聊天机器人在政治上过于"觉醒"之际。

唐纳德·特朗普总统的许多亲密伙伴，包括亿万富翁埃隆·马斯克和加密货币与AI"沙皇"大卫·萨克斯，都曾指责流行的AI聊天机器人审查保守派观点。萨克斯历来将OpenAI的ChatGPT视为"被编程为觉醒派"，并在政治主题上不诚实。

实际上，AI中的偏见是一个难以解决的技术问题。马斯克自己的AI公司xAI也一直在努力创建一个不会支持某些政治观点胜过其他观点的聊天机器人。

这并没有阻止包括OpenAI在内的公司调整其AI模型，使其回答比以前更多的问题，特别是与争议主题相关的问题。

来源：Techcrunch

0赞

好文章，需要你的鼓励

Meta发布Llama 4，新一代旗舰AI模型

来源：Techcrunch

2025

04/07

09:44

分享

点赞

数智时代，openGauss Summit 2025即将发布哪些技术创新破局

“算力+储能”深度融合：超智算发布分布式算力超级节点储能解决方案

联想推出DE6600系列：更智能的存储解决方案

创业公司如何在严格监管行业中实现生死攸关的创新

OpenAI发布GPT-5.2-Codex模型，软件工程自动化能力大幅提升

Waterfox浏览器宣布拒绝AI功能，瞄准Firefox忠实用户

TikTok美国业务出售交易将于下月完成

破局AI数据中心安全瓶颈：Fortinet联合NVIDIA引领隔离式加速新航向

智算中心进化论，科华数据如何做到“更懂”

更高负载、更快建设：2026年数据中心六大趋势

Snowflake数据库更新引发全球大规模服务中断

AI编程初创公司Lovable融资3.3亿美元，英伟达等科技巨头支持

AI 代理决策的错误假设

Google 发布 Gemini 模型的速度快于其 AI 安全报告

AI 视频生成创企 Runway 以 30 亿美元估值融资 3.08 亿美元

Amazon Nova Act 重磅发布：挑战 OpenAI、Microsoft 和 Salesforce 的全新 AI 代理 SDK

DeepMind 详解 AGI 可能给世界带来的威胁

超越通用基准测试：Yourbench 如何让企业用实际数据评估 AI 模型

Devin 2.0 来袭：Cognition 将 AI 软件工程师月费从 500 美元大幅降至 20 美元

边缘 AI 机器人和智能设备即将到来

全球风投融资在第一季度达到 1130 亿美元，AI 大额交易成主要驱动力

CoreWeave 令人失望的 IPO 是否预示着 AI 泡沫？

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: