Meta 正启动一项新计划,旨在激励创业公司采用其 Llama AI 模型。
该计划名为 Llama for Startups,提供来自 Meta Llama 团队的“直接支持”,在某些情况下还包括资金支持。任何在美国注册成立、融资金额不足 1000 万美元、至少拥有一名开发人员并致力于构建生成式 AI 应用的公司,都可以在 5 月 30 日截止前申请。
Meta 在博客中写道:“会员每月最多可获得 6000 美元,为期六个月,以帮助他们抵消构建和改进生成式 AI 解决方案的成本。我们的专家将与他们密切合作,协助启动并探索 Llama 的高级用例,从而使他们的创业公司受益。”
随着 Meta 力图稳固其在激烈竞争的开放模型领域中的领先地位,Llama 创业公司计划的启动正值关键时刻。尽管这家科技巨头的 Llama 模型迄今已累计下载量超过 10 亿次,但 DeepSeek、Google 以及阿里巴巴的 Qwen 等竞争对手正试图颠覆 Meta 建立广泛模型生态系统的努力。
近期情况并不乐观,Llama 在过去几个月中经历了数次挫折。
《华尔街日报》上周报道,由于担心该模型在关键基准测试中表现不佳,Meta 推迟了旗舰 AI 模型 Llama 4 Behemoth 的推出。四月份,Meta 不得不应对外界指控其在广受欢迎的众包 AI 基准 LM Arena 上作弊的问题。该公司曾使用优化为“对话性”的 Llama 4 Maverick 模型版本在 LM Arena 上取得高分,但随后公开发布的 Maverick 版本则有所不同。
Meta 对 Llama —— 以及其更广泛的生成式 AI 产品组合抱有巨大期望。去年,该公司预测其生成式 AI 产品在 2025 年的收入将达到 20 亿至 30 亿美元,并在 2035 年前实现 4600 亿至 1.4 万亿美元的收入。
Meta 与部分托管其 Llama 模型的公司签订了收入分成协议。近期,该公司还推出了一个用于定制 Llama 版本的 API。而 Meta AI —— 由 Llama 提供支持的公司 AI 助手 —— 最终可能展示广告,并提供附加功能的订阅服务,正如 CEO Mark Zuckerberg 在公司第一季度财报电话会议上所述。
这些产品的构建成本极高。2024 年,Meta 的 “GenAI” 预算已超过 9 亿美元,而今年可能将超过 10 亿美元。这还不包括运行和训练模型所需的基础设施开支。Meta 先前表示,计划在 2025 年将资本支出投入 600 亿至 800 亿美元,主要用于建设新的数据中心。
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
上海交通大学研究团队发布了突破性的科学推理数据集MegaScience,包含125万高质量实例,首次从12000本大学教科书中大规模提取科学推理训练数据。该数据集显著提升了AI模型在物理、化学、生物等七个学科的推理能力,训练的模型在多项基准测试中超越官方版本,且具有更高的训练效率。研究团队完全开源了数据集、处理流程和评估系统。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。