Meta 正启动一项新计划,旨在激励创业公司采用其 Llama AI 模型。
该计划名为 Llama for Startups,提供来自 Meta Llama 团队的“直接支持”,在某些情况下还包括资金支持。任何在美国注册成立、融资金额不足 1000 万美元、至少拥有一名开发人员并致力于构建生成式 AI 应用的公司,都可以在 5 月 30 日截止前申请。
Meta 在博客中写道:“会员每月最多可获得 6000 美元,为期六个月,以帮助他们抵消构建和改进生成式 AI 解决方案的成本。我们的专家将与他们密切合作,协助启动并探索 Llama 的高级用例,从而使他们的创业公司受益。”
随着 Meta 力图稳固其在激烈竞争的开放模型领域中的领先地位,Llama 创业公司计划的启动正值关键时刻。尽管这家科技巨头的 Llama 模型迄今已累计下载量超过 10 亿次,但 DeepSeek、Google 以及阿里巴巴的 Qwen 等竞争对手正试图颠覆 Meta 建立广泛模型生态系统的努力。
近期情况并不乐观,Llama 在过去几个月中经历了数次挫折。
《华尔街日报》上周报道,由于担心该模型在关键基准测试中表现不佳,Meta 推迟了旗舰 AI 模型 Llama 4 Behemoth 的推出。四月份,Meta 不得不应对外界指控其在广受欢迎的众包 AI 基准 LM Arena 上作弊的问题。该公司曾使用优化为“对话性”的 Llama 4 Maverick 模型版本在 LM Arena 上取得高分,但随后公开发布的 Maverick 版本则有所不同。
Meta 对 Llama —— 以及其更广泛的生成式 AI 产品组合抱有巨大期望。去年,该公司预测其生成式 AI 产品在 2025 年的收入将达到 20 亿至 30 亿美元,并在 2035 年前实现 4600 亿至 1.4 万亿美元的收入。
Meta 与部分托管其 Llama 模型的公司签订了收入分成协议。近期,该公司还推出了一个用于定制 Llama 版本的 API。而 Meta AI —— 由 Llama 提供支持的公司 AI 助手 —— 最终可能展示广告,并提供附加功能的订阅服务,正如 CEO Mark Zuckerberg 在公司第一季度财报电话会议上所述。
这些产品的构建成本极高。2024 年,Meta 的 “GenAI” 预算已超过 9 亿美元,而今年可能将超过 10 亿美元。这还不包括运行和训练模型所需的基础设施开支。Meta 先前表示,计划在 2025 年将资本支出投入 600 亿至 800 亿美元,主要用于建设新的数据中心。
好文章,需要你的鼓励
今天讲的出海案例是开创电气,一家金华手持式电动工具制造商,在越南基地完成首款产品验收并形成80万台年产能力。
JETSPEC是由UC San Diego等机构联合提出的推测解码框架,通过树形因果掩码让草稿头在一次前向传播中生成分支一致的候选树,在MATH-500上实现最高9.64倍端到端加速。
研究人员意外发现,标准MOSFET晶体管可同时模拟神经元和突触行为,形成"神经突触随机存取存储器"(NSRAM)。该技术仅需一至两个晶体管即可实现传统需数十乃至数百个元件才能完成的神经信号处理,且与现有硅基制造工艺完全兼容,良率达100%。未来有望应用于边缘AI及高能效神经形态芯片,长远或可挑战GPU地位。
本文介绍了中国科学院自动化所的研究,揭示了大型语言模型在多轮工具调用强化学习中崩溃的根本原因,并系统评估了五种监督信号对训练稳定性和泛化能力的影响。