2020 年,Dbt Labs 的数据分析工具还只是费城一家小型咨询公司的副业项目,虽然拥有忠实的用户群,但收入微不足道。CEO Tristan Handy 向 Forbes 透露,五年后的今天,这款工具已成为一家快速发展的企业核心产品,拥有超过 5,000 个付费客户,年经常性收入超过 1 亿美元。
近十年前,Handy 因为作为数据分析师使用笨重软件的frustration,创立了这家公司 (之前名为 Fishtown Analytics)。尽管 Amazon Redshift 和 Fivetran 等云端数据工具已经流行,但开发者们并不知道如何充分利用它们,于是他开始创办咨询业务来提供帮助。
在与客户合作的过程中,Handy 决定开发一个工具,让数据清理和格式转换这些繁琐的任务更像软件工程 - 数据工程师可以编写代码和运行测试,而不是"用胶带东拼西凑"。这可以让经常因任何改动而容易崩溃的内部系统变得更可靠和高效。这反过来可以帮助企业更快地梳理杂乱无章的数据集,找到模式和数据点来辅助决策。Handy 说,这是咨询公司的"最佳秘密武器"。
随后公司将 Dbt Core (全称"data built tool") 开源,希望为咨询服务带来免费宣传。但它意外走红并持续获得稳定采用;2020 年 Fishtown 转型并更名为 Dbt Labs,成为一家软件公司。
其企业级数据管理工具 Dbt Cloud 和 Dbt Core 目前已被约 50,000 个团队使用,过去两年收入增长约 80%。Conde Nast、Nasdaq 和 Siemens 等公司都在使用 Dbt Labs 的产品来简化和格式化数据并从中获取新信息。
"他们已经从初创企业成长为规模化企业,"在 2020 年领投该公司 3,000 万美元 B 轮融资的 Sequoia 合伙人 Matt Miller 说。多年来,该公司已从 Sequoia 及 Altimeter、Amplify Partners 和 Andreessen Horowitz 等顶级投资者那里筹集了超过 4 亿美元的资金,在 2022 年估值达到 42 亿美元。
在全球疫情期间,随着公司向云端迁移并数字化数据,该公司获得了初步增长。现在又一个趋势正在推动公司发展:人工智能。企业领导者正在构建新的生成式 AI 应用,并寻找方法在内部利用 AI 提高效率。这些努力的核心是优质、干净的数据,这给了 Dbt 一个新机会,提供工具帮助使数据更容易被模型摄取。"AI 确实是我们的一个利好因素,"Handy 说。
Miller 表示,他最初是通过他投资组合中另一个数据巨头了解到这家公司的:收入达 28 亿美元 (2024 年) 的 Snowflake。Dbt 的扩张战略之一是作为 Databricks 和 Snowflake 等不同数据仓库的上层,这些仓库存储和处理海量数据,并"成为跨平台运作的大脑,"Miller 说。今年 1 月,该公司收购了 SDF Labs,这家公司开发分析数据在平台之间流动的软件。
Dbt Labs 最近为其产品增加了新功能,帮助人们使用自然语言提示来询问数据相关问题,并自动化数据工程师工作的某些部分,如测试数据质量和生成文档。这家成立九年的公司计划继续专注于其细分领域的专业用户,为数据从业者添加更多功能。CEO Handy 表示,这些用户在工具方面一直"得不到充分服务"。
好文章,需要你的鼓励
英特尔携手戴尔以及零克云,通过打造“工作站-AI PC-云端”的协同生态,大幅缩短AI部署流程,助力企业快速实现从想法验证到规模化落地。
意大利ISTI研究院推出Patch-ioner零样本图像描述框架,突破传统局限实现任意区域精确描述。系统将图像拆分为小块,通过智能组合生成从单块到整图的统一描述,无需区域标注数据。创新引入轨迹描述任务,用户可用鼠标画线获得对应区域描述。在四大评测任务中全面超越现有方法,为人机交互开辟新模式。
阿联酋阿布扎比人工智能大学发布全新PAN世界模型,超越传统大语言模型局限。该模型具备通用性、交互性和长期一致性,能深度理解几何和物理规律,通过"物理推理"学习真实世界材料行为。PAN采用生成潜在预测架构,可模拟数千个因果一致步骤,支持分支操作模拟多种可能未来。预计12月初公开发布,有望为机器人、自动驾驶等领域提供低成本合成数据生成。
MIT研究团队发现,AI系统无需严格配对的多模态数据也能显著提升性能。他们开发的UML框架通过参数共享让AI从图像、文本、音频等不同类型数据中学习,即使这些数据间没有直接对应关系。实验显示这种方法在图像分类、音频识别等任务上都超越了单模态系统,并能自发发展出跨模态理解能力,为未来AI应用开辟了新路径。