2020 年,Dbt Labs 的数据分析工具还只是费城一家小型咨询公司的副业项目,虽然拥有忠实的用户群,但收入微不足道。CEO Tristan Handy 向 Forbes 透露,五年后的今天,这款工具已成为一家快速发展的企业核心产品,拥有超过 5,000 个付费客户,年经常性收入超过 1 亿美元。
近十年前,Handy 因为作为数据分析师使用笨重软件的frustration,创立了这家公司 (之前名为 Fishtown Analytics)。尽管 Amazon Redshift 和 Fivetran 等云端数据工具已经流行,但开发者们并不知道如何充分利用它们,于是他开始创办咨询业务来提供帮助。
在与客户合作的过程中,Handy 决定开发一个工具,让数据清理和格式转换这些繁琐的任务更像软件工程 - 数据工程师可以编写代码和运行测试,而不是"用胶带东拼西凑"。这可以让经常因任何改动而容易崩溃的内部系统变得更可靠和高效。这反过来可以帮助企业更快地梳理杂乱无章的数据集,找到模式和数据点来辅助决策。Handy 说,这是咨询公司的"最佳秘密武器"。
随后公司将 Dbt Core (全称"data built tool") 开源,希望为咨询服务带来免费宣传。但它意外走红并持续获得稳定采用;2020 年 Fishtown 转型并更名为 Dbt Labs,成为一家软件公司。
其企业级数据管理工具 Dbt Cloud 和 Dbt Core 目前已被约 50,000 个团队使用,过去两年收入增长约 80%。Conde Nast、Nasdaq 和 Siemens 等公司都在使用 Dbt Labs 的产品来简化和格式化数据并从中获取新信息。
"他们已经从初创企业成长为规模化企业,"在 2020 年领投该公司 3,000 万美元 B 轮融资的 Sequoia 合伙人 Matt Miller 说。多年来,该公司已从 Sequoia 及 Altimeter、Amplify Partners 和 Andreessen Horowitz 等顶级投资者那里筹集了超过 4 亿美元的资金,在 2022 年估值达到 42 亿美元。
在全球疫情期间,随着公司向云端迁移并数字化数据,该公司获得了初步增长。现在又一个趋势正在推动公司发展:人工智能。企业领导者正在构建新的生成式 AI 应用,并寻找方法在内部利用 AI 提高效率。这些努力的核心是优质、干净的数据,这给了 Dbt 一个新机会,提供工具帮助使数据更容易被模型摄取。"AI 确实是我们的一个利好因素,"Handy 说。
Miller 表示,他最初是通过他投资组合中另一个数据巨头了解到这家公司的:收入达 28 亿美元 (2024 年) 的 Snowflake。Dbt 的扩张战略之一是作为 Databricks 和 Snowflake 等不同数据仓库的上层,这些仓库存储和处理海量数据,并"成为跨平台运作的大脑,"Miller 说。今年 1 月,该公司收购了 SDF Labs,这家公司开发分析数据在平台之间流动的软件。
Dbt Labs 最近为其产品增加了新功能,帮助人们使用自然语言提示来询问数据相关问题,并自动化数据工程师工作的某些部分,如测试数据质量和生成文档。这家成立九年的公司计划继续专注于其细分领域的专业用户,为数据从业者添加更多功能。CEO Handy 表示,这些用户在工具方面一直"得不到充分服务"。
好文章,需要你的鼓励
在他看来,企业对AI的恐惧源自未知,而破解未知的钥匙,就藏在“AI平台+开源”这个看似简单的公式里。
斯坦福和魁北克研究团队首创"超新星事件数据集",通过让AI分析历史事件和科学发现来测试其"性格"。研究发现不同AI模型确实表现出独特而稳定的思维偏好:有些注重成就结果,有些关注情感关系,有些偏向综合分析。这项突破性研究为AI评估开辟了新方向,对改善人机协作和AI工具选择具有重要意义。
Pure Storage发布企业数据云(EDC),整合其现有产品组合,提供增强的数据存储可见性和基于策略的简化管理。EDC集成了Purity存储操作系统、Fusion资源管理、Pure1舰队管理和Evergreen消费模式等架构元素,提供类云存储管理环境。该方案支持声明式策略驱动管理,让客户专注业务成果而非基础设施管理。同时发布高性能闪存阵列和300TB直接闪存模块,并与Rubrik合作提供网络安全防护能力。
威斯康星大学研究团队提出"生成-筛选-排序"策略,通过结合快速筛选器和智能奖励模型,在AI代码验证中实现了11.65倍速度提升,准确率仅下降8.33%。该方法先用弱验证器移除明显错误代码,再用神经网络模型精确排序,有效解决了传统方法在速度与准确性之间的两难选择,为实用化AI编程助手铺平了道路。