据华尔街日报报道,OpenAI 正寻求以 3400 亿美元的估值融资高达 400 亿美元。
软银集团预计将领投此轮融资。据报道,这家日本科技集团可能投资 150 亿至 250 亿美元。据华尔街日报称,软银还在帮助这家 ChatGPT 开发商寻找其他可能有意参与交易的投资者。
这份报告发布于软银三个月前参与的一轮融资之后,当时 OpenAI 以 1570 亿美元的估值融资 66 亿美元。软银reportedly 准备以明显更高的估值再次投资,这表明其对 OpenAI 的增长前景持乐观态度。去年 9 月,纽约时报报道称,这家 ChatGPT 开发商预计在 2024 年底实现 37 亿美元收入,并期望在 2029 年达到 1000 亿美元。
尽管 OpenAI 的营收增长迅速,但目前仍未盈利。华尔街日报报道称,公司此次融资的部分资金将用于支持其亏损的业务运营。
这轮融资还将用于支持 Project Stargate,这是 OpenAI 上周在白宫宣布的一项基础设施计划。该公司计划与软银、Oracle 公司和投资公司 MGX 合作,在美国建设人工智能数据中心网络。该项目预计耗资高达 5000 亿美元。
据 The Information 上周报道,OpenAI 和软银各自承诺为该计划投入约 190 亿美元。据英国金融时报报道的消息来源称,这些公司计划通过向"现有投资者"募资以及债务融资来支付 AI 数据中心的其余成本。
本月早些时候,中国 AI 实验室 DeepSeek 开源了一个名为 R1 的大语言模型。该算法在多个基准测试中达到了与 OpenAI 的推理优化模型 o1 相当的性能。OpenAI 正在筹集的 400 亿美元可能使其更好地应对来自 DeepSeek 和其他竞争对手的挑战。
R1 的发布表明,预算明显较小的初创公司可能也能够匹敌 OpenAI 的前沿模型。在一篇学术论文中,DeepSeek 的研究人员详细说明,他们使用价值 560 万美元的显卡时间训练了 R1。这只是 OpenAI 据信在其大语言模型上投入的一小部分。
在 R1 发布后,OpenAI 承诺"将在未来推出更好的模型"。这轮传闻中的融资应该能让实现这一目标变得更容易。如果这笔投资成功,还将给 OpenAI 更多时间来找到盈利地提供 AI 服务的方法。
好文章,需要你的鼓励
南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
AWS通过升级SageMaker机器学习平台来扩展市场地位,新增观测能力、连接式编码环境和GPU集群性能管理功能。面对谷歌和微软的激烈竞争,AWS专注于为企业提供AI基础设施支撑。SageMaker新功能包括深入洞察模型性能下降原因、为开发者提供更多计算资源控制权,以及支持本地IDE连接部署。这些更新主要源于客户需求,旨在解决AI模型开发中的实际问题。
MTS AI研究团队提出RewardRanker系统,通过重排序模型和迭代自训练显著提升AI代码生成质量。该方法让13.4B参数模型超越33B大模型,在多种编程语言上表现优异,甚至在C++上超越GPT-4。通过引入困难负样本和PPO优化,系统能从多个代码候选中选出最优方案,为AI编程助手的实用化奠定基础。