数据产业正处于剧烈变革的边缘。
市场正在整合。如果过去两个月的交易流量具有指标意义——Databricks以10亿美元收购Neon,Salesforce以80亿美元收购云管理公司Informatica——那么更多收购的势头正在形成。
被收购的公司在规模、成立时间和数据堆栈内的专注领域可能有所不同,但它们都有一个共同点:这些公司被收购,是希望被收购的技术能成为推动企业采用AI的关键缺失环节。
从表面来看,这种策略是有道理的。
AI公司和AI应用的成功取决于对优质底层数据的访问。没有这些数据,就没有价值——这是企业风投共同的信念。在2024年12月进行的TechCrunch调查中,企业风投表示数据质量是AI初创企业脱颖而出并成功的关键因素。虽然这些交易中涉及的一些公司不是初创企业,但这种观点仍然成立。
Gaurav Dhillon——Informatica的联合创始人和前首席执行官,目前担任数据集成公司SnapLogic的董事长兼首席执行官——在最近接受TechCrunch采访时呼应了这一观点。
"企业数据管理和流动方式正在发生彻底重置,"Dhillon说。"如果人们想抓住AI发展的机遇,他们必须大幅重新构建数据平台。我认为这就是你看到所有这些数据收购的原因,因为这是制定稳健AI战略的基础。"
但是,在当今快速创新的市场中,这种收购ChatGPT之前构建的公司的策略是否是提高企业AI采用率的方法?这还不清楚。Dhillon也有疑虑。
"没有人生来就懂AI;这只有三年历史,"Dhillon说,指的是当前的后ChatGPT AI市场。"对于大公司来说,要提供AI创新来重新定义企业,特别是智能体企业,需要大量重新工具化才能实现。"
**数据格局分化**
数据产业在过去十年中发展成为一个庞大而分散的网络——这使得它成熟,适合整合。它所需要的只是一个催化剂。仅从2020年到2024年,根据PitchBook数据,超过3000亿美元投资于数据初创企业,涉及超过24,000笔交易。
数据产业没有免受其他行业(如SaaS)趋势的影响,过去十年的风投激增导致许多初创企业获得风险投资家的资金,这些投资家只针对一个特定领域,或者在某些情况下围绕单一功能构建。
当前行业标准是将一堆不同的数据管理解决方案捆绑在一起,每个解决方案都有自己的特定焦点,但当你希望AI在你的数据中爬行寻找答案或构建应用程序时,这种方法就行不通了。
大公司寻求收购能够插入并填补其数据堆栈现有空白的初创企业,这是有道理的。这一趋势的完美例子是Fivetran在5月收购Census——是的,这是以AI的名义进行的。
Fivetran帮助公司将数据从各种来源移动到云数据库。在其13年的业务中,它不允许客户将这些数据移回所述数据库,这正是Census提供的服务。这意味着在此次收购之前,Fivetran客户需要与第二家公司合作来创建端到端解决方案。
需要明确的是,这并不是要对Fivetran投下阴影。在交易时,Fivetran的联合创始人兼首席执行官George Fraser告诉TechCrunch,虽然在这些仓库中移入和移出数据似乎是同一枚硬币的两面,但实际上并不那么简单;公司甚至尝试并放弃了解决这个问题的内部解决方案。
"从技术角度来说,如果你查看这些服务底层的代码,它们实际上相当不同,"Fraser当时说。"要做到这一点,你必须解决一系列相当不同的问题。"
这种情况有助于说明数据市场在过去十年中是如何转变的。对于Sanjeev Mohan——前Gartner分析师,现在经营自己的数据趋势咨询公司SanjMo——这些类型的场景是当前整合浪潮的重要驱动力。
"这种整合是由客户对大量不兼容产品的厌倦推动的,"Mohan说。"我们生活在一个非常有趣的世界里,有很多不同的数据存储解决方案,你可以使用开源,可以使用Kafka,但我们失败的一个领域是元数据。数十种这些产品正在捕获一些元数据,但要完成它们的工作,存在重叠。"
**对初创企业有利**
Mohan说,更广泛的市场也在这里发挥作用。数据初创企业正在努力筹集资本,Mohan说,退出比不得不关闭或承担债务要好。对于收购方来说,增加功能给他们更好的定价杠杆和对同行的优势。
"如果Salesforce或Google不收购这些公司,那么它们的竞争对手可能会,"PitchBook高级新兴技术分析师Derek Hernandez告诉TechCrunch。"最好的解决方案目前正在被收购。即使你有获奖的解决方案,我不知道保持私有的前景最终会胜过去更大的收购方。"
这一趋势为被收购的初创企业带来了巨大好处。风投市场渴望退出,目前IPO的安静期没有给他们太多机会。被收购不仅提供了退出,而且在许多情况下,它还为这些创始团队提供了继续构建的空间。
Mohan表示同意,并补充说许多数据初创企业正在感受到当前市场在退出和风险投资资金缓慢恢复方面的痛苦。
"在这个时候,收购对他们来说是一个更有利的退出策略,"Hernandez说。"所以我认为,双方都非常有动力到达终点线。我认为Informatica是一个很好的例子,即使与Salesforce去年与他们谈判的价格相比有所下降,但根据他们的董事会,这仍然是最好的解决方案。"
**接下来会发生什么**
但对于这种收购策略是否能实现买家的目标,疑虑仍然存在。
正如Dhillon指出的,被收购的数据库公司并不一定是为了轻松适应快速变化的AI市场而构建的。此外,如果拥有最好数据的公司赢得AI世界,那么数据和AI公司成为独立实体还有意义吗?
"我认为很多价值在于将主要AI参与者与数据管理公司合并,"Hernandez说。"我不知道独立的数据管理公司是否特别有动力保持这种状态,并且像在企业和AI解决方案之间充当第三方。"
好文章,需要你的鼓励
法国AI初创公司Mistral AI发布了首个大语言模型全面生命周期评估,量化了AI的环境代价。其Mistral Large 2模型训练产生20,400吨二氧化碳当量,消耗281,000立方米水。运营阶段占环境影响85%,远超硬件制造成本。研究表明地理位置和模型大小显著影响碳足迹,企业可通过选择适当规模模型、批处理技术和清洁能源部署来减少环境影响。这一透明度为企业AI采购决策提供了新的评估标准。
上海AI实验库推出YUME系统,用户只需输入一张图片就能创建可键盘控制的虚拟世界。该系统采用创新的运动量化技术,将复杂的三维控制简化为WASD键操作,并通过智能记忆机制实现无限长度的世界探索。系统具备强大的跨风格适应能力,不仅能处理真实场景,还能重现动漫、游戏等各种艺术风格的虚拟世界,为虚拟现实和交互娱乐领域提供了全新的技术路径。
许多人认为一旦实现通用人工智能(AGI)和人工智能超级智能(ASI),这些高度先进的AI将能够告诉我们人生的真正意义。然而,巅峰AI可能无法明确回答这个史诗般的问题。即使AI拥有人类所有知识,也不意味着能从中找到生命意义的答案。AI可能会选择提供多种可能性而非绝对答案,以避免分裂人类社会。
上海AI实验室研究团队开发了革命性的AI编程验证方法,让大语言模型能够在最小人工干预下自动生成和验证程序规范。该方法摒弃传统的人工标注训练,采用强化学习让模型在形式化语言空间中自主探索,在Dafny编程验证任务上显著超越现有方法,为AI自主学习开辟新道路。