Astronomer 公司作为 Apache Airflow 编排软件的开发商,推出了 Astro Observe 平台,标志着公司从单一产品向竞争激烈的数据运营平台市场的扩张。此举正值企业在推进 AI 项目落地和维护大规模可靠数据管道时面临挑战之际。
这个新平台旨在通过将编排和可观察性功能整合到一个解决方案中,帮助组织更有效地监控和排查其数据工作流。这种整合可能会显著降低许多公司在管理数据基础设施时面临的复杂性。
Astronomer 公司 CTO Julian LaNeve 在接受 VentureBeat 采访时表示:"以前,我们的客户需要来找我们处理编排数据管道,然后还要去寻找不同的数据可观察性和 Airflow 可观察性供应商。我们正试图让这一切变得更简单,在一个平台上为客户提供所有功能。"
AI 驱动的预测分析旨在防止管道故障 Astro Observe 的一个关键特点是能够在管道故障影响业务运营之前预测潜在问题。该平台包含一个 AI 驱动的"洞察引擎",通过分析数百个客户部署的模式来提供主动优化建议。
LaNeve 解释道:"我们实际上会在 SLA 发生前两小时告诉用户,由于上游某些延迟,他们可能会错过目标。这使人们从被动应对转向更主动的方式,可以在下游利益相关者发现之前开始解决问题。"
在组织努力使 AI 模型实现落地的当下,这个时机尤为重要。虽然人们普遍关注模型开发,但维护可靠的数据管道以支持这些模型已变得越来越关键。
从开源成功到企业数据管理 该平台建立在 Astronomer 对 Apache Airflow 的深入专业知识基础之上,这个开源工作流管理平台目前每月下载量超过 3000 万次,相比四年前 Airflow 2.0 不到 100 万的下载量有了显著增长。
一个值得注意的特性是"全局供应链图",它提供了数据血缘和运营依赖关系的可视化。这有助于团队理解不同数据资产和工作流之间的复杂关系,这对于维护大规模部署的可靠性至关重要。
该平台还引入了"数据产品"概念,允许团队对相关数据资产进行分组并分配服务级别协议 (SLA)。这种方法通过提供清晰的数据可靠性和交付指标,帮助技术团队和业务利益相关者之间建立联系。
随着企业工具整合,市场竞争加剧 早期采用者 GumGum(一家情境智能公司)已经从该平台中受益。GumGum 高级工程经理 Brendan Frick 表示:"在编排alongside增加数据可观察性,使我们能够在问题影响用户和下游系统之前提前应对。"
Astronomer 的扩张恰逢企业increasingly寻求整合其数据工具之际。随着组织通常需要同时使用八个或更多来自不同供应商的工具,向统一平台发展的趋势可能预示着企业数据管理格局的更广泛转变。
对 Astronomer 来说,挑战在于如何在保持编排领域领先地位的同时与已经建立的可观察性厂商竞争。然而,其与 Airflow 的深度集成以及对主动管理的关注可能会在快速发展的 AI 基础设施工具市场中赢得优势。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。