Iceberg时代来临：StarTree成为采用热门表格式的最新厂商

开源Iceberg正成为数据湖表格式的通用标准，StarTree是最新将其作为实时后端的供应商。StarTree Cloud基于Apache Pinot构建，现可作为Iceberg之上的分析和服务层。该公司声称Iceberg支持能将其从被动存储格式转变为实时后端，为面向客户的应用和AI代理提供高并发服务。与其他查询引擎不同，StarTree专为低延迟、高并发访问而构建，可直接在原生Iceberg表上提供实时查询加速。

Iceberg正在成为数据湖表格式的通用语言，StarTree是最新将其作为实时后端采用的供应商。

开源的Iceberg是一个面向大规模分析的开放表格式，它本身不像传统数据库那样存储或执行查询。它作为一个软件层运行在存储系统之上，如Parquet、ORC和Avro，以及云对象存储如AWS S3、Azure Blob和Google Cloud Store，处理元数据、分区和模式演进。Iceberg提供ACID事务、模式版本控制和时间旅行功能，数据查询和处理由单独的软件处理，如Apache Flink、Presto、Spark、Trino和其他分析引擎。

StarTree Cloud是基于Apache Pinot构建的完全托管的云原生平台，Apache Pinot是一个实时分布式OLAP（在线分析处理）数据存储。StarTree Cloud专为OLAP设计，能够对来自流式数据源（如Apache Kafka、Amazon Kinesis）和批处理数据源（如AWS S3、Snowflake）的大规模数据进行低延迟查询（毫秒级）和高吞吐量处理（每秒10,000+查询）。现在它既可以作为Iceberg之上的分析层，也可以作为服务层。

StarTree声称，Iceberg支持可以将其从被动存储格式转变为实时后端，能够为面向客户的应用程序和智能体提供支持，在高并发情况下为数千名同时用户提供一致的速度和可靠性服务。

StarTree联合创始人兼首席执行官Kishore Gopalakrishna表示："我们看到面向客户，以及日益面向智能体的数据产品出现爆炸性增长，这些产品要求亚秒级响应和新鲜见解。与此同时，Iceberg正在成为大规模管理历史数据的行业标准。"

"随着这两个趋势的融合，StarTree通过作为Iceberg的实时服务层提供独特价值，使公司能够安全、可扩展地为数百万外部用户和智能体提供服务，而无需移动数据。"

最近采用Iceberg的厂商包括Snowflake、Confluent、AWS的S3、SingleStore和Databricks。

theCUBE Research首席分析师Paul Nashawaty表示："Apache Iceberg正在迅速成为在开放数据湖仓中管理大规模分析数据的事实标准——根据theCUBE Research的数据，采用率同比激增超过60%。"

StarTree断言，大多数围绕Iceberg和Parquet构建的现有查询引擎难以满足面向外部、高并发分析应用程序所需的性能SLA，公司历史上一直避免直接从其湖仓提供数据服务。它声称通过结合Iceberg和Parquet开放表格式与Pinot的索引和高性能服务能力，StarTree直接在原生Iceberg表上提供实时查询加速。

与Presto、Trino和类似引擎不同，StarTree表示它专为低延迟、高并发访问而构建，直接与Iceberg集成，通过以下功能提升性能：

StarTree Cloud对Apache Iceberg和Parquet的原生支持

实时索引和聚合，包括对数值、文本、JSON和地理索引的支持

通过StarTree索引实现智能物化视图

用于低延迟、高并发查询的本地缓存和修剪

无需数据移动——直接从Iceberg提供服务

从Iceberg进行智能预取，最大限度减少无关数据扫描

Nashawaty认为："StarTree以亚秒级延迟服务Iceberg数据且无需数据重复的能力是一个独特而及时的进步。它解决了在现代数据产品中访问历史数据的关键性能需求。"

StarTree Cloud对Apache Iceberg的支持今天已在私有预览版中提供。更多信息请访问www.startree.ai。

来源：BLOCKS & FILES

0赞

好文章，需要你的鼓励

Iceberg时代来临：StarTree成为采用热门表格式的最新厂商

来源：BLOCKS & FILES

2025

07/24

09:21

分享

点赞

Glean年收入突破3亿美元，削减AI成本成核心卖点

蓝色起源"新格伦"火箭在佛罗里达测试中发生爆炸

智能体AI正在重塑企业架构与Token经济学

堪培拉理工学院如何借助技术革新重塑课堂教学体验

Gemma 4携手Arm：优化端侧AI，加速移动应用体验

制药公司与初创企业如何携手推动AI落地

《星球大战》导演盛赞生成式AI：电影制作的革命性工具

Salesforce借助Informatica布局企业级无头数据管理架构

几乎所有M5 MacBook Air配置现在都降价近200美元

大模型评测风向变了，Testin云测如何构建企业级AI质量标尺？

因民事养老金管理失误，英国政府拒绝向Capita授予5.63亿英镑合同

YouTube提升AI生成视频标签的显示效果

StarTree支持Apache Iceberg以扩展湖仓架构应用场景

中国分布式数据库最新报告：OceanBase居本地部署市场两项第一

DDN推出Infinia存储系统，声称可大幅提升AI推理速度并降低成本

铠侠UFS 4.1闪存承诺提升AI应用性能表现

甲骨文：想要AI玩的溜，关键在于数据融合

微软开发者将SAP ABAP向量数据库移植到ZX Spectrum

AMD在AI领域持续发力，仍有大量工作要做

OceanBase品牌升级：启用中文名“海扬数据库”

Voltron Data力推AMD，为GPU加速SQL注入新动力

ScyllaDB发布基于Raft算法的新数据库服务，提升规模化能力

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: