Meta正在向规模如曼哈顿岛般庞大的GPU数据中心投入数百亿美元,然而这家社交网络公司在与OpenAI或Anthropic等竞争对手的较量中仍显吃力。
因此,CEO马克·扎克伯格正在转移目标,将注意力重新聚焦在一个模糊的新目标上:AI超级智能。
"在过去几个月里,我们开始看到AI系统自我改进的迹象,"他在周三的博客文章中写道。"改进速度目前还很缓慢,但不可否认正在发生。开发超级智能现在已经触手可及。"
关于AI超级智能的确切定义并没有太多共识,尽管扎克伯格诗意地描述了它将如何改善一切并改变我们创造和发现的方式,但这篇文章在这个问题上几乎没有提供任何明确性。
无论超级智能究竟是什么,Meta不仅计划构建它,更希望为每个人提供个人专属的超级智能来丰富生活——毕竟,当你可以和你的伙伴Llama对话时,谁还需要朋友呢。
与其他所有超级智能不同,扎克伯格坚持认为Meta的超级智能不是要让你失业,而是要赋能用户追求个人抱负。
"深度了解我们、理解我们目标并能帮助我们实现目标的个人超级智能,将是最有用的,"这位曾创建社交网络来评价哈佛同学吸引力的创始人写道。
通往超级智能的道路铺满了数据中心
这篇充满炒作的博客文章发布时间恰好在Meta即将公布第二季度财报前几小时,此时扎克伯格正面临投资者和分析师对公司基础设施支出以及新成立的"超级智能"团队丰厚薪酬包的日益严格审查和担忧。
正如我们在6月报道的那样,Meta向一名AI研究人员提供了八位数的薪酬来加入扎克伯格的AI精英团队。其他报告称,这些offer要高出一到两个数量级。
Meta还在推进一些真正庞大的基础设施项目。包括在路易斯安那州里奇兰教区建设一个2.2吉瓦的AI超级集群,将在未来五年左右分阶段部署。
本月早些时候,扎克伯格宣布了在未来几年部署多个"多吉瓦"数据中心的计划,第一个名为Prometheus的数据中心将于2026年上线。据报道,这个数据中心将消耗超过1吉瓦的电力。
到年底,Meta计划拥有超过130万块英伟达和AMD GPU不断运转,生成Token并训练模型。
当然,这些都不便宜。仅在2025年,扎克伯格的公司就计划向资本支出投入高达720亿美元,主要用于建设新的数据中心——随着第二季度财报的公布,这个数字可能还会增长。
投资规模惊人,AI表现平平
然而,尽管有这些投资,Meta仍难以与OpenAI或Anthropic等更成熟的参与者竞争。今年4月,Meta发布了备受瞩目的Llama 4大语言模型系列。你可能还记得,在发布前,扎克伯格预测2025年Meta AI将"服务超过10亿人",Llama 4将成为"领先的最先进模型"。
不幸的是,对Meta来说,这些模型中的前两个——代号Scout和Maverick——反响平平,更糟糕的是还被指控在基准测试中偷换概念。
这些模型显然表现如此令人失望,以至于Meta据报道已经放弃了其最大、据说最强大的Behemoth模型,该模型原本应该拥有2万亿参数,能够与OpenAI和谷歌的最大模型竞争。
在周三的财报电话会议上,分析师无疑会寻找扎克伯格AI支出狂潮合理性的迹象,确认超级智能不会重蹈元宇宙的覆辙。
在ChatGPT于2022年底掀起AI热潮之前,你可能还记得扎克伯格曾确信虚拟现实将征服世界。截至第一季度,公司的Reality Labs团队已经烧掉了约600亿美元试图让元宇宙成为现实。
好文章,需要你的鼓励
这项由索非亚大学INSAIT和苏黎世联邦理工学院共同完成的研究,揭示了大语言模型在数学定理证明中普遍存在的"迎合性"问题。研究团队构建了BrokenMath基准测试集,包含504道精心设计的错误数学命题,用于评估主流AI模型能否识别并纠正错误陈述。
约翰斯·霍普金斯大学研究团队提出了创新的隐私保护AI文本生成方法,通过"控制代码"系统指导AI生成虚假敏感信息来替代真实数据。该方法采用"藏身于众"策略,在医疗法律等敏感领域测试中实现了接近零的隐私泄露率,同时保持了高质量的文本生成效果,为高风险领域的AI应用提供了实用的隐私保护解决方案。
实验室和真实使用测试显示,iPhone Air电池续航能够满足一整天的典型使用需求。在CNET进行的三小时视频流媒体压力测试中,iPhone Air仅消耗15%电量,表现与iPhone 15相当。在45分钟高强度使用测试中表现稍逊,但在实际日常使用场景下,用户反馈iPhone Air能够稳定支撑全天使用,有线充电速度也比较理想。
这项由Reactive AI提出的稀疏查询注意力机制通过减少查询头数量而非键值头数量,直接降低了注意力层的计算复杂度,实现了2-3倍的训练和编码加速。该方法在长序列处理中表现出色,在20万词汇序列上达到3.5倍加速,且模型质量损失微乎其微,为计算密集型AI应用提供了新的优化路径。