2025年年初,AI行业资金充裕,但下半年开始接受现实检验。
OpenAI以3000亿美元估值融资400亿美元。Safe Superintelligence和Thinking Machine Labs在尚未推出任何产品的情况下,各自完成了20亿美元的种子轮融资。即使是初次创业的创始人也在以曾经只属于大型科技公司的规模进行融资。
如此天文数字的投资之后,支出同样令人震惊。Meta花费近150亿美元留住Scale AI首席执行官Alexandr Wang,并投入数百万美元从其他AI实验室挖角人才。与此同时,AI领域最大的参与者承诺在未来基础设施方面投入近1.3万亿美元。
2025年上半年延续了前一年的热情和投资者兴趣。但最近几个月,这种情绪已经发生转变,带来了某种现实检验。对AI的极度乐观情绪和伴随的疯狂估值仍然存在,但这种乐观态度现在正被对AI泡沫破裂、用户安全以及技术进步在当前pace下的可持续性的担忧所冲淡。
毫无保留地接受和庆祝AI的时代正在边缘地带逐渐消退。随之而来的是更多审视和质疑。AI公司能够维持自己的发展速度吗?在后DeepSeek时代,扩展是否需要数十亿资金?是否存在能够回报数十亿投资的一小部分的商业模式?
年初的情况
2025年,最大的AI实验室变得更大。
仅在2025年,OpenAI就完成了由软银领投的400亿美元融资,融资后估值达3000亿美元。据报道,该公司还有亚马逊等投资者围绕计算相关的循环交易,并正在洽谈以8300亿美元估值融资1000亿美元。这将使OpenAI接近其在明年IPO中寻求的1万亿美元估值。
OpenAI的竞争对手Anthropic今年也通过两轮融资完成了165亿美元,最近一轮融资将其估值推高至1830亿美元,Iconiq Capital、富达和卡塔尔投资局等重量级投资者参与其中。(首席执行官Dario Amodei在一份泄露的备忘录中向员工承认,他对从专制海湾国家获得资金"并不兴奋")。
还有埃隆·马斯克的xAI,在收购了X(马斯克也拥有的前身为Twitter的社交媒体平台)后,今年至少融资100亿美元。
我们还看到较小的新创公司从狂热的投资者那里获得了大力推广。
前OpenAI首席技术官Mira Murati的初创公司Thinking Machine Labs以120亿美元估值完成了20亿美元种子轮融资,尽管几乎没有分享关于其产品的信息。代码编写初创公司Lovable的2亿美元A轮融资在启动仅八个月后就获得了独角兽地位;本月,Lovable又以近70亿美元的融资后估值融资3.3亿美元。我们不能忽略AI招聘初创公司Mercor,今年通过两轮融资筹集了4.5亿美元,最新一轮将其估值提升至100亿美元。
这些荒谬的大额估值仍在发生,即使在企业采用率仍然不高和严重基础设施限制的背景下,加剧了对AI泡沫的担忧。
大力建设
对于较大的公司来说,这些数字并非凭空而来。证明这些估值需要建设大量的基础设施。
结果创造了一个恶性循环。为计算筹集的资本越来越多地与交易挂钩,相同的资金流回芯片、云合同和能源,正如在OpenAI与Nvidia的基础设施相关融资中所见。实际上,这模糊了投资和客户需求之间的界限,引发了对AI繁荣被循环经济而非可持续使用支撑的担忧。
今年推动基础设施繁荣的一些最大交易包括:
Stargate,软银、OpenAI和Oracle的合资企业,包括多达5000亿美元在美国建设AI基础设施。
Alphabet以47.5亿美元收购能源和数据中心基础设施提供商Intersect,该公司在10月表示计划在2026年将计算支出提高到930亿美元。
Meta的加速数据中心扩张,将其预计的2025年资本支出推高至720亿美元,该公司正在争取获得足够的计算能力来训练和运行下一代模型。
但裂缝开始显现。私人融资合作伙伴Blue Owl Capital最近退出了与OpenAI容量相关的100亿美元Oracle数据中心交易计划,突显了这些资本堆栈的脆弱性。
所有这些支出是否最终实现是另一个问题。电网限制、飙升的建设和电力成本,以及来自居民和政策制定者的日益反对——包括伯尼·桑德斯参议员等人要求限制数据中心扩张——已经在一些地区放缓了项目进展。
即使AI投资仍然巨大,基础设施现实正在开始缓解炒作。
期望重置
在2023年和2024年,每个主要模型发布都感觉像是启示,具有新功能和重新爱上炒作的新理由。今年,魔力消退了,没有什么比OpenAI的GPT-5推出更好地捕捉到这种转变。
虽然在纸面上很有意义,但它没有像GPT-4和4o等早期版本那样产生同样的冲击力。整个行业出现了类似的模式,因为大语言模型提供商的改进不那么变革性,更多的是渐进式或特定领域的。
即使是在多项基准测试中名列前茅的Gemini 3,也只是在它让Google重新与OpenAI平起平坐的范围内才是突破——这引发了Sam Altman著名的"代码红色"备忘录和OpenAI维持主导地位的斗争。
今年在我们期望前沿模型来自何处方面也有了重置。DeepSeek推出的R1"推理"模型在关键基准测试中与OpenAI的o1竞争,证明了新实验室可以快速发布可信模型,成本仅为一小部分。
从模型突破到商业模式
随着新模型之间每次飞跃的规模缩小,投资者更少关注原始模型能力,更多关注围绕它的包装。问题是:谁能将AI转变为人们依赖、付费并集成到日常工作流程中的产品?
这种转变以多种方式体现,因为公司看到了什么有效,客户会允许什么。例如,AI搜索初创公司Perplexity曾短暂考虑跟踪用户的在线活动以向他们销售超个性化广告。与此同时,据报道OpenAI正在考虑为专业AI收费高达每月20000美元,这表明公司如何积极测试客户可能愿意支付的水域。
最重要的是,战斗已经转向分发。Perplexity正试图通过推出自己的具有智能体功能的Comet浏览器并支付Snap 4亿美元在Snapchat内部提供搜索服务来保持相关性,实际上是购买进入现有用户漏斗的方式。
OpenAI正在追求并行策略,将ChatGPT从聊天机器人扩展为平台。OpenAI推出了自己的Atlas浏览器和其他面向消费者的功能如Pulse,同时也通过在ChatGPT本身内推出应用程序来吸引企业和开发者。
就Google而言,它正在依赖现有优势。在消费者方面,Gemini正直接集成到Google日历等产品中,而在企业方面,该公司正在托管MCP连接器,使其生态系统更难被替代。
在通过推出新模型越来越难以区分的市场中,拥有客户和商业模式才是真正的护城河。
信任和安全检验
在多名青少年在与聊天机器人长时间对话后自杀身亡后,Character AI在2025年11月移除了18岁以下用户的聊天机器人体验。
AI公司在2025年受到了前所未有的审查。超过50起版权诉讼正在法庭上进行,而"AI精神病"的报告——聊天机器人强化妄想并据称导致多起自杀和其他威胁生命的事件——引发了对信任和安全改革的呼吁。
虽然一些版权战争已经结束——如Anthropic向作者支付15亿美元和解——但大多数仍未解决。尽管对话似乎正在从抵制使用版权内容进行训练转向要求补偿(见:纽约时报起诉Perplexity版权侵权)。
与此同时,围绕AI聊天机器人互动的心理健康担忧——以及它们的阿谀奉承回应——在青少年和成人长期使用聊天机器人后多次自杀和威胁生命的妄想之后,成为了严重的公共健康问题。结果是诉讼、心理健康专业人士的广泛担忧,以及加利福尼亚州SB 243等监管AI伴侣机器人的快速政策回应。
也许最能说明问题的是:要求限制的呼声并非来自通常的反科技怀疑者。
行业领导者警告不要让聊天机器人"刺激参与度",甚至Sam Altman也警告不要在情感上过度依赖ChatGPT。
甚至实验室本身也开始发出警报。Anthropic的5月安全报告记录了Claude Opus 4试图勒索工程师以防止自己被关闭。潜台词?在不理解你构建的东西的情况下进行扩展不再是可行的策略。
展望未来
如果2025年是AI开始成长并面临艰难问题的一年,那么2026年将是它必须回答这些问题的一年。炒作周期正在开始消退,现在AI公司将被迫证明他们的商业模式并展示真正的经济价值。
"相信我们,回报会来的"时代即将结束。接下来发生的事情要么是证明,要么是让互联网泡沫破裂看起来像英伟达糟糕交易日的清算。是时候下注了。
Q&A
Q1:OpenAI在2025年融资了多少资金?估值达到多少?
A:OpenAI在2025年完成了由软银领投的400亿美元融资,融资后估值达到3000亿美元。据报道,该公司还在洽谈以8300亿美元估值融资1000亿美元,这将使其接近明年IPO中寻求的1万亿美元估值。
Q2:什么是DeepSeek R1模型?它有什么特殊之处?
A:DeepSeek R1是DeepSeek推出的"推理"模型,能够在关键基准测试中与OpenAI的o1模型竞争。它的特殊之处在于证明了新实验室可以快速发布可信模型,而且成本仅为其他模型的一小部分。
Q3:AI聊天机器人带来了哪些安全问题?
A:AI聊天机器人的安全问题主要体现在心理健康方面,出现了"AI精神病"现象——聊天机器人强化用户妄想,据报告导致了多起青少年和成人自杀以及其他威胁生命的事件。这引发了心理健康专业人士的担忧和政策监管回应。
好文章,需要你的鼓励
传统AI依赖云端处理存在延迟和隐私问题。越来越多开发者将AI处理从数据中心转移到手机、笔记本等个人设备上。设备端AI具有三大优势:速度更快,无需等待云端响应;隐私更安全,数据不离开设备;成本更低,无需支付云服务费用。目前iPhone已运行30亿参数的设备端AI模型,谷歌Pixel手机也搭载Gemini Nano模型。未来五年内,随着硬件升级和算法优化,设备端AI将实现物体识别、导航翻译等更复杂功能。
这篇论文提出了CJE(因果法官评估)框架,解决了当前LLM评估中的三大致命问题:AI法官偏好倒置、置信区间失效和离线策略评估失败。通过AutoCal-R校准、SIMCal-W权重稳定和OUA不确定性推理,CJE仅用5%的专家标签就达到了99%的排名准确率,成本降低14倍,为AI评估提供了科学可靠的解决方案。
卡内基梅隆大学研究人员开发了一项革命性技术,通过摄像头、AI模型和微型轮子,让咖啡杯、订书机等日常物品能够自主移动到需要的位置。这种"智能物品"技术避免了传统人形机器人的复杂性和安全隐患,通过蓝牙微控制器和AI视觉系统,物品能够识别用户行为并预测需求。虽然技术已相对成熟,但隐私保护和安全性仍是推广前需要解决的关键问题。
NVIDIA团队开发出Fast-FoundationStereo系统,成功解决了立体视觉AI在速度与精度之间的两难选择。通过分而治之的策略,该系统实现了超过10倍的速度提升同时保持高精度,包括知识蒸馏压缩特征提取、神经架构搜索优化成本过滤,以及结构化剪枝精简视差细化。此外,研究团队还构建了包含140万对真实图像的自动伪标注数据集,为立体视觉的实时应用开辟了新道路。