StarTree Inc.是一家基于Apache Pinot开源在线分析处理数据库销售实时分析平台和云服务的公司,今日成为最新一家宣布全面支持Apache Iceberg的数据分析提供商。
StarTree Cloud托管服务将从今日起采用Iceberg作为其数据湖仓之上的分析和服务层。该公司表示,此举为Iceberg在需要数千名用户高并发的实时应用中创造了新的使用场景。特别是,它使Iceberg更容易应用于面向客户的场景,组织希望在不依赖复杂多步骤管道的情况下对外公开数据。
Iceberg是一个位于云存储数据文件之上的管理层,用于改善一致性、可管理性和查询性能。它作为事实上的表标准正在快速获得认可,取代了各种专有替代方案。
Iceberg为Parquet等格式的结构化文件提供事务性访问,Parquet是一种针对大型分析数据集优化高效读写访问的列式存储文件格式。然而,Iceberg缺乏处理低延迟、高并发查询的原生能力。
因此,组织通常将Iceberg数据提取到单独的系统中,如键值存储或专有格式,以实现亚秒级响应。这些需要工程密集型管道和数据重复,同时限制了灵活性。
查询复杂性
StarTree产品负责人Chinmay Soman表示:"你不仅在重复数据,还在放大数据本身,因为你必须实现维度和指标的所有组合,以便在类似键值存储的方式中轻松查询。"
StarTree表示,它能够直接查询Iceberg表,无需移动或转换底层数据。该集成支持开放格式,并利用性能增强功能,包括Pinot索引和物化、本地缓存和智能预取。
首席营销官Chad Meley表示:"如今的数据产品越来越依赖湖仓的历史数据,但一直缺少服务层。通过以亚秒级延迟直接查询Iceberg,我们消除了对中间管道、重复存储和外部数据库的需求。"
高管们表示,Iceberg支持将StarTree的目标市场扩展到其最初专注的流式和低延迟分析之外。Meley说:"这对我们来说确实是一个新的使用场景。我们解决的主要挑战不再仅仅是数据新鲜度。而是帮助客户构建可扩展的数据产品,而无需所有的冗余和复杂性。"
StarTree能够直接在Iceberg表上定义各种索引和预聚合物化。数值数据、文本、JavaScript对象表示法、地理空间数据和其他类型的索引可以分布在计算节点本地或存储在对象存储中。
Soman表示,该集成基于StarTree已经完成的查询Parquet文件和基于S3对象存储的工作。他说:"Parquet不是为随机读取访问设计的,但我们已经调整了Pinot来将其用作前向索引。结合我们对Iceberg清单和元数据的理解,为我们提供了所需的构建块。"
数据保持原位
该公司强调,其查询引擎仍使用专有索引策略来实现性能,但数据本身保持开放格式。Meley说:"我们不会将数据从Iceberg移动到StarTree的专有格式中。在这种情况下,唯一专有的是索引。"
对Iceberg的支持使金融科技公司等客户能够使用StarTree为面向商户的仪表板提供支持,这些仪表板报告历史现金流或队列收入指标。运输和物流组织正在构建交互式仪表板,以审查跨时间的交付性能、错误率和路线效率。在这两种情况下,数据不需要是实时的,但仍必须在严格的服务级别协议下为大型用户群提供服务。
SiliconANGLE姊妹市场研究公司theCUBE Research的首席分析师Paul Nashawaty表示,这种方法解决了现代数据架构中日益增长的差距。他说:"Iceberg的采用正在加速,但大多数查询引擎无法满足面向客户应用的性能服务级别协议。StarTree在不重复的情况下以高并发服务Iceberg数据的能力是一个及时的进步。"
Soman表示,使用Iceberg而不是Pinot的专有原生格式会有轻微的性能权衡,但Pinot仍然能够以亚秒级延迟处理每秒数百个查询。
Meley表示,支持Iceberg的决定既反映了市场动力也反映了客户的实际需求。他说:"我们所有的客户都在询问Iceberg。它正在成为湖仓存储的标准,这使我们能够原生支持它,同时简化服务数据产品的架构。"
好文章,需要你的鼓励
自动驾驶开发商Nuro与豪华电动车制造商Lucid建立合作伙伴关系,获得Uber投资,共同打造机器人出租车新玩家。Nuro从纯配送市场转向授权自动驾驶技术,Lucid负责车辆制造并集成Nuro硬件设计,Uber拥有并运营车辆。该合作计划6年内生产至少2万辆汽车,主打豪华路线。随着行业竞争加剧,成本控制和差异化服务将成为关键因素。
ByteDance团队开发的GR-3是一个革命性的视觉-语言-动作模型,让机器人能够像人类一样理解指令并灵活操作。它通过多模态数据联合训练获得了强大的泛化能力,能处理未见过的物品和环境,还能从少量人类演示中快速学习。在三个挑战性任务上全面超越现有基准,展现了迈向通用机器人助手的巨大潜力。
Wayback 0.1正式发布,这是一个新的Wayland显示服务器的首个预览版本。该项目旨在为坚持使用X11的用户提供"足够的Wayland功能来让Xwayland正常工作"。虽然这是预览版本,但对于需求简单的用户来说已经可以日常使用。作为alpha质量软件,仍有许多功能未实现或正在开发中。Wayback能让用户在不需要完整X11服务器的情况下继续使用现有的X11环境,但目前缺少DPMS电源管理、多屏支持等功能。
上海人工智能实验室联合多家机构提出SeC视频分割技术,通过大型视觉语言模型构建物体概念表示,突破传统像素匹配局限。该技术在复杂场景变化中表现卓越,比SAM 2.1平均提升11.8分,并构建了专门的SeCVOS测试集验证效果,为视频编辑、自动驾驶等应用带来新突破。