Meta 正启动一项新计划,旨在激励创业公司采用其 Llama AI 模型。
该计划名为 Llama for Startups,提供来自 Meta Llama 团队的“直接支持”,在某些情况下还包括资金支持。任何在美国注册成立、融资金额不足 1000 万美元、至少拥有一名开发人员并致力于构建生成式 AI 应用的公司,都可以在 5 月 30 日截止前申请。
Meta 在博客中写道:“会员每月最多可获得 6000 美元,为期六个月,以帮助他们抵消构建和改进生成式 AI 解决方案的成本。我们的专家将与他们密切合作,协助启动并探索 Llama 的高级用例,从而使他们的创业公司受益。”
随着 Meta 力图稳固其在激烈竞争的开放模型领域中的领先地位,Llama 创业公司计划的启动正值关键时刻。尽管这家科技巨头的 Llama 模型迄今已累计下载量超过 10 亿次,但 DeepSeek、Google 以及阿里巴巴的 Qwen 等竞争对手正试图颠覆 Meta 建立广泛模型生态系统的努力。
近期情况并不乐观,Llama 在过去几个月中经历了数次挫折。
《华尔街日报》上周报道,由于担心该模型在关键基准测试中表现不佳,Meta 推迟了旗舰 AI 模型 Llama 4 Behemoth 的推出。四月份,Meta 不得不应对外界指控其在广受欢迎的众包 AI 基准 LM Arena 上作弊的问题。该公司曾使用优化为“对话性”的 Llama 4 Maverick 模型版本在 LM Arena 上取得高分,但随后公开发布的 Maverick 版本则有所不同。
Meta 对 Llama —— 以及其更广泛的生成式 AI 产品组合抱有巨大期望。去年,该公司预测其生成式 AI 产品在 2025 年的收入将达到 20 亿至 30 亿美元,并在 2035 年前实现 4600 亿至 1.4 万亿美元的收入。
Meta 与部分托管其 Llama 模型的公司签订了收入分成协议。近期,该公司还推出了一个用于定制 Llama 版本的 API。而 Meta AI —— 由 Llama 提供支持的公司 AI 助手 —— 最终可能展示广告,并提供附加功能的订阅服务,正如 CEO Mark Zuckerberg 在公司第一季度财报电话会议上所述。
这些产品的构建成本极高。2024 年,Meta 的 “GenAI” 预算已超过 9 亿美元,而今年可能将超过 10 亿美元。这还不包括运行和训练模型所需的基础设施开支。Meta 先前表示,计划在 2025 年将资本支出投入 600 亿至 800 亿美元,主要用于建设新的数据中心。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。