数据产业正处于剧烈变革的边缘。
市场正在整合。如果过去两个月的交易流量具有指标意义——Databricks以10亿美元收购Neon,Salesforce以80亿美元收购云管理公司Informatica——那么更多收购的势头正在形成。
被收购的公司在规模、成立时间和数据堆栈内的专注领域可能有所不同,但它们都有一个共同点:这些公司被收购,是希望被收购的技术能成为推动企业采用AI的关键缺失环节。
从表面来看,这种策略是有道理的。
AI公司和AI应用的成功取决于对优质底层数据的访问。没有这些数据,就没有价值——这是企业风投共同的信念。在2024年12月进行的TechCrunch调查中,企业风投表示数据质量是AI初创企业脱颖而出并成功的关键因素。虽然这些交易中涉及的一些公司不是初创企业,但这种观点仍然成立。
Gaurav Dhillon——Informatica的联合创始人和前首席执行官,目前担任数据集成公司SnapLogic的董事长兼首席执行官——在最近接受TechCrunch采访时呼应了这一观点。
"企业数据管理和流动方式正在发生彻底重置,"Dhillon说。"如果人们想抓住AI发展的机遇,他们必须大幅重新构建数据平台。我认为这就是你看到所有这些数据收购的原因,因为这是制定稳健AI战略的基础。"
但是,在当今快速创新的市场中,这种收购ChatGPT之前构建的公司的策略是否是提高企业AI采用率的方法?这还不清楚。Dhillon也有疑虑。
"没有人生来就懂AI;这只有三年历史,"Dhillon说,指的是当前的后ChatGPT AI市场。"对于大公司来说,要提供AI创新来重新定义企业,特别是智能体企业,需要大量重新工具化才能实现。"
**数据格局分化**
数据产业在过去十年中发展成为一个庞大而分散的网络——这使得它成熟,适合整合。它所需要的只是一个催化剂。仅从2020年到2024年,根据PitchBook数据,超过3000亿美元投资于数据初创企业,涉及超过24,000笔交易。
数据产业没有免受其他行业(如SaaS)趋势的影响,过去十年的风投激增导致许多初创企业获得风险投资家的资金,这些投资家只针对一个特定领域,或者在某些情况下围绕单一功能构建。
当前行业标准是将一堆不同的数据管理解决方案捆绑在一起,每个解决方案都有自己的特定焦点,但当你希望AI在你的数据中爬行寻找答案或构建应用程序时,这种方法就行不通了。
大公司寻求收购能够插入并填补其数据堆栈现有空白的初创企业,这是有道理的。这一趋势的完美例子是Fivetran在5月收购Census——是的,这是以AI的名义进行的。
Fivetran帮助公司将数据从各种来源移动到云数据库。在其13年的业务中,它不允许客户将这些数据移回所述数据库,这正是Census提供的服务。这意味着在此次收购之前,Fivetran客户需要与第二家公司合作来创建端到端解决方案。
需要明确的是,这并不是要对Fivetran投下阴影。在交易时,Fivetran的联合创始人兼首席执行官George Fraser告诉TechCrunch,虽然在这些仓库中移入和移出数据似乎是同一枚硬币的两面,但实际上并不那么简单;公司甚至尝试并放弃了解决这个问题的内部解决方案。
"从技术角度来说,如果你查看这些服务底层的代码,它们实际上相当不同,"Fraser当时说。"要做到这一点,你必须解决一系列相当不同的问题。"
这种情况有助于说明数据市场在过去十年中是如何转变的。对于Sanjeev Mohan——前Gartner分析师,现在经营自己的数据趋势咨询公司SanjMo——这些类型的场景是当前整合浪潮的重要驱动力。
"这种整合是由客户对大量不兼容产品的厌倦推动的,"Mohan说。"我们生活在一个非常有趣的世界里,有很多不同的数据存储解决方案,你可以使用开源,可以使用Kafka,但我们失败的一个领域是元数据。数十种这些产品正在捕获一些元数据,但要完成它们的工作,存在重叠。"
**对初创企业有利**
Mohan说,更广泛的市场也在这里发挥作用。数据初创企业正在努力筹集资本,Mohan说,退出比不得不关闭或承担债务要好。对于收购方来说,增加功能给他们更好的定价杠杆和对同行的优势。
"如果Salesforce或Google不收购这些公司,那么它们的竞争对手可能会,"PitchBook高级新兴技术分析师Derek Hernandez告诉TechCrunch。"最好的解决方案目前正在被收购。即使你有获奖的解决方案,我不知道保持私有的前景最终会胜过去更大的收购方。"
这一趋势为被收购的初创企业带来了巨大好处。风投市场渴望退出,目前IPO的安静期没有给他们太多机会。被收购不仅提供了退出,而且在许多情况下,它还为这些创始团队提供了继续构建的空间。
Mohan表示同意,并补充说许多数据初创企业正在感受到当前市场在退出和风险投资资金缓慢恢复方面的痛苦。
"在这个时候,收购对他们来说是一个更有利的退出策略,"Hernandez说。"所以我认为,双方都非常有动力到达终点线。我认为Informatica是一个很好的例子,即使与Salesforce去年与他们谈判的价格相比有所下降,但根据他们的董事会,这仍然是最好的解决方案。"
**接下来会发生什么**
但对于这种收购策略是否能实现买家的目标,疑虑仍然存在。
正如Dhillon指出的,被收购的数据库公司并不一定是为了轻松适应快速变化的AI市场而构建的。此外,如果拥有最好数据的公司赢得AI世界,那么数据和AI公司成为独立实体还有意义吗?
"我认为很多价值在于将主要AI参与者与数据管理公司合并,"Hernandez说。"我不知道独立的数据管理公司是否特别有动力保持这种状态,并且像在企业和AI解决方案之间充当第三方。"
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。