StarTree支持Apache Iceberg以扩展湖仓架构应用场景

基于Apache Pinot的实时分析平台StarTree宣布其云服务将全面支持Apache Iceberg，将其作为数据湖仓之上的分析和服务层。此举为Iceberg在需要支持数千并发用户的实时应用中创造了新的使用场景，特别是面向客户的外部数据展示场景。StarTree能够直接查询Iceberg表而无需移动或转换底层数据，支持亚秒级延迟的高并发查询，消除了中间管道、重复存储和外部数据库的需求。

StarTree Inc.是一家基于Apache Pinot开源在线分析处理数据库销售实时分析平台和云服务的公司，今日成为最新一家宣布全面支持Apache Iceberg的数据分析提供商。

StarTree Cloud托管服务将从今日起采用Iceberg作为其数据湖仓之上的分析和服务层。该公司表示，此举为Iceberg在需要数千名用户高并发的实时应用中创造了新的使用场景。特别是，它使Iceberg更容易应用于面向客户的场景，组织希望在不依赖复杂多步骤管道的情况下对外公开数据。

Iceberg是一个位于云存储数据文件之上的管理层，用于改善一致性、可管理性和查询性能。它作为事实上的表标准正在快速获得认可，取代了各种专有替代方案。

Iceberg为Parquet等格式的结构化文件提供事务性访问，Parquet是一种针对大型分析数据集优化高效读写访问的列式存储文件格式。然而，Iceberg缺乏处理低延迟、高并发查询的原生能力。

因此，组织通常将Iceberg数据提取到单独的系统中，如键值存储或专有格式，以实现亚秒级响应。这些需要工程密集型管道和数据重复，同时限制了灵活性。

查询复杂性

StarTree产品负责人Chinmay Soman表示："你不仅在重复数据，还在放大数据本身，因为你必须实现维度和指标的所有组合，以便在类似键值存储的方式中轻松查询。"

StarTree表示，它能够直接查询Iceberg表，无需移动或转换底层数据。该集成支持开放格式，并利用性能增强功能，包括Pinot索引和物化、本地缓存和智能预取。

首席营销官Chad Meley表示："如今的数据产品越来越依赖湖仓的历史数据，但一直缺少服务层。通过以亚秒级延迟直接查询Iceberg，我们消除了对中间管道、重复存储和外部数据库的需求。"

高管们表示，Iceberg支持将StarTree的目标市场扩展到其最初专注的流式和低延迟分析之外。Meley说："这对我们来说确实是一个新的使用场景。我们解决的主要挑战不再仅仅是数据新鲜度。而是帮助客户构建可扩展的数据产品，而无需所有的冗余和复杂性。"

StarTree能够直接在Iceberg表上定义各种索引和预聚合物化。数值数据、文本、JavaScript对象表示法、地理空间数据和其他类型的索引可以分布在计算节点本地或存储在对象存储中。

Soman表示，该集成基于StarTree已经完成的查询Parquet文件和基于S3对象存储的工作。他说："Parquet不是为随机读取访问设计的，但我们已经调整了Pinot来将其用作前向索引。结合我们对Iceberg清单和元数据的理解，为我们提供了所需的构建块。"

数据保持原位

该公司强调，其查询引擎仍使用专有索引策略来实现性能，但数据本身保持开放格式。Meley说："我们不会将数据从Iceberg移动到StarTree的专有格式中。在这种情况下，唯一专有的是索引。"

对Iceberg的支持使金融科技公司等客户能够使用StarTree为面向商户的仪表板提供支持，这些仪表板报告历史现金流或队列收入指标。运输和物流组织正在构建交互式仪表板，以审查跨时间的交付性能、错误率和路线效率。在这两种情况下，数据不需要是实时的，但仍必须在严格的服务级别协议下为大型用户群提供服务。

SiliconANGLE姊妹市场研究公司theCUBE Research的首席分析师Paul Nashawaty表示，这种方法解决了现代数据架构中日益增长的差距。他说："Iceberg的采用正在加速，但大多数查询引擎无法满足面向客户应用的性能服务级别协议。StarTree在不重复的情况下以高并发服务Iceberg数据的能力是一个及时的进步。"

Soman表示，使用Iceberg而不是Pinot的专有原生格式会有轻微的性能权衡，但Pinot仍然能够以亚秒级延迟处理每秒数百个查询。

Meley表示，支持Iceberg的决定既反映了市场动力也反映了客户的实际需求。他说："我们所有的客户都在询问Iceberg。它正在成为湖仓存储的标准，这使我们能够原生支持它，同时简化服务数据产品的架构。"

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

StarTree支持Apache Iceberg以扩展湖仓架构应用场景

来源：SiliconANGLE

2025

07/24

09:18

分享

点赞

数智时代，openGauss Summit 2025即将发布哪些技术创新破局

“算力+储能”深度融合：超智算发布分布式算力超级节点储能解决方案

联想推出DE6600系列：更智能的存储解决方案

创业公司如何在严格监管行业中实现生死攸关的创新

OpenAI发布GPT-5.2-Codex模型，软件工程自动化能力大幅提升

Waterfox浏览器宣布拒绝AI功能，瞄准Firefox忠实用户

TikTok美国业务出售交易将于下月完成

破局AI数据中心安全瓶颈：Fortinet联合NVIDIA引领隔离式加速新航向

智算中心进化论，科华数据如何做到“更懂”

更高负载、更快建设：2026年数据中心六大趋势

Snowflake数据库更新引发全球大规模服务中断

AI编程初创公司Lovable融资3.3亿美元，英伟达等科技巨头支持

Windows 11中的Copilot Vision功能向微软服务器传输数据

NatWest银行携手AWS和埃森哲打造AI驱动的客户服务革新

AI洞察过载：您的企业是否正淹没在数据分析中？

谷歌开放式湖仓架构：企业AI数据应用基石

开源MCPEval让协议级智能体测试即插即用

研究显示：谷歌AI概览功能导致搜索点击率大幅下降

AI驱动的预测性维护技术日益受到关注

韩国AI芯片新星FuriosaAI凭借低功耗设计赢得LG青睐

iOS 18 beta 4发布：Liquid Glass界面调整与AI新闻摘要功能回归

亚马逊收购AI可穿戴设备Bee，实现全天候语音记录

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: