微软近日宣布收购AI数据工程平台Osmos,旨在增强其Fabric数据平台的功能,此举也意味着微软开始向合作伙伴的市场领域扩张。
Osmos成立于2019年,该公司已在基于开源Apache Spark的Fabric平台上提供数据管道和上传产品。微软Azure数据分析企业副总裁Bogdan Crivat在博客文章中表示,此次收购将支持Fabric的使命,为客户提供"将所有数据和分析统一到单一安全平台"的解决方案。
Crivat表示:"通过收购Osmos,我们正朝着自主AI智能体与人类协同工作的未来迈出下一步,这将帮助减少运营开销,让客户更容易地在整个组织内连接、准备、分析和共享数据。"
微软产品高级总监Roy Hasson在单独声明中表示,此次收购将通过AI技术简化基于Apache Spark的提取-转换-加载(ETL)数据工程任务。他在社交媒体上发布的帖子中提到:"近两年前,Osmos在微软Fabric上推出了AI数据处理器和AI数据工程智能体作为原生应用,使客户能够快速解包、转换和处理复杂的非结构化或半结构化数据,转换为存储在微软数据湖OneLake中的即用型Iceberg表。"
Hasson还表示:"我们很快意识到客户喜欢在Fabric Spark之上使用Osmos,这将他们的开发和维护工作量减少了50%。"
这一声明暗示了微软数据平台策略重点的转变。Fabric数据平台于2023年末推出,当时严重依赖来自Databricks的开源技术。Databricks与微软保持密切合作,并将其产品深度集成到Azure云平台中。
Databricks最初基于开源Spark构建,但后来已经扩展到其他领域。两家公司紧密集成的一个例子是微软的镜像数据复制功能,它将外部数据库的快照以Delta Parquet格式传输到OneLake。Delta Parquet是一种开源表格格式,最初由Databricks开发,是Iceberg的竞争对手。微软最初将Delta作为Fabric上的首选表格格式,尽管它也支持Iceberg,而Databricks希望长期将Iceberg与Delta集成。
随着收购Osmos,微软的重点正在从Delta和Databricks转移。Databricks在Azure上也提供自动化ETL工具,现在必须与另一个微软旗下的产品竞争。
Osmos联合创始人兼首席执行官Kirat Pandya是微软和谷歌的资深人士。2021年,Osmos获得了1300万美元的融资,由光速创投合伙人Raviraj Jain领投,CRV、Pear和SV Angel参与投资。微软收购的具体金额未披露。
Q&A
Q1:Osmos是什么?它能为微软Fabric带来什么功能?
A:Osmos是一个AI辅助的数据工程平台,成立于2019年。它能为微软Fabric带来AI数据处理和智能数据工程功能,帮助客户快速处理复杂的非结构化数据,将开发和维护工作量减少50%。
Q2:微软收购Osmos对Databricks意味着什么?
A:这意味着微软数据平台策略的重点转变。Databricks原本与微软保持密切合作,在Azure上提供自动化ETL工具,但现在必须与微软旗下的Osmos产品竞争,两家公司的合作关系可能会发生变化。
Q3:Osmos的AI数据工程智能体有什么具体优势?
A:Osmos的AI数据工程智能体能够自动处理提取-转换-加载(ETL)任务,帮助客户快速解包、转换复杂的非结构化或半结构化数据,转换为即用型数据表,大大减少了人工操作和维护成本。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。