StarTree Inc.是一家基于Apache Pinot开源在线分析处理数据库销售实时分析平台和云服务的公司,今日成为最新一家宣布全面支持Apache Iceberg的数据分析提供商。
StarTree Cloud托管服务将从今日起采用Iceberg作为其数据湖仓之上的分析和服务层。该公司表示,此举为Iceberg在需要数千名用户高并发的实时应用中创造了新的使用场景。特别是,它使Iceberg更容易应用于面向客户的场景,组织希望在不依赖复杂多步骤管道的情况下对外公开数据。
Iceberg是一个位于云存储数据文件之上的管理层,用于改善一致性、可管理性和查询性能。它作为事实上的表标准正在快速获得认可,取代了各种专有替代方案。
Iceberg为Parquet等格式的结构化文件提供事务性访问,Parquet是一种针对大型分析数据集优化高效读写访问的列式存储文件格式。然而,Iceberg缺乏处理低延迟、高并发查询的原生能力。
因此,组织通常将Iceberg数据提取到单独的系统中,如键值存储或专有格式,以实现亚秒级响应。这些需要工程密集型管道和数据重复,同时限制了灵活性。
查询复杂性
StarTree产品负责人Chinmay Soman表示:"你不仅在重复数据,还在放大数据本身,因为你必须实现维度和指标的所有组合,以便在类似键值存储的方式中轻松查询。"
StarTree表示,它能够直接查询Iceberg表,无需移动或转换底层数据。该集成支持开放格式,并利用性能增强功能,包括Pinot索引和物化、本地缓存和智能预取。
首席营销官Chad Meley表示:"如今的数据产品越来越依赖湖仓的历史数据,但一直缺少服务层。通过以亚秒级延迟直接查询Iceberg,我们消除了对中间管道、重复存储和外部数据库的需求。"
高管们表示,Iceberg支持将StarTree的目标市场扩展到其最初专注的流式和低延迟分析之外。Meley说:"这对我们来说确实是一个新的使用场景。我们解决的主要挑战不再仅仅是数据新鲜度。而是帮助客户构建可扩展的数据产品,而无需所有的冗余和复杂性。"
StarTree能够直接在Iceberg表上定义各种索引和预聚合物化。数值数据、文本、JavaScript对象表示法、地理空间数据和其他类型的索引可以分布在计算节点本地或存储在对象存储中。
Soman表示,该集成基于StarTree已经完成的查询Parquet文件和基于S3对象存储的工作。他说:"Parquet不是为随机读取访问设计的,但我们已经调整了Pinot来将其用作前向索引。结合我们对Iceberg清单和元数据的理解,为我们提供了所需的构建块。"
数据保持原位
该公司强调,其查询引擎仍使用专有索引策略来实现性能,但数据本身保持开放格式。Meley说:"我们不会将数据从Iceberg移动到StarTree的专有格式中。在这种情况下,唯一专有的是索引。"
对Iceberg的支持使金融科技公司等客户能够使用StarTree为面向商户的仪表板提供支持,这些仪表板报告历史现金流或队列收入指标。运输和物流组织正在构建交互式仪表板,以审查跨时间的交付性能、错误率和路线效率。在这两种情况下,数据不需要是实时的,但仍必须在严格的服务级别协议下为大型用户群提供服务。
SiliconANGLE姊妹市场研究公司theCUBE Research的首席分析师Paul Nashawaty表示,这种方法解决了现代数据架构中日益增长的差距。他说:"Iceberg的采用正在加速,但大多数查询引擎无法满足面向客户应用的性能服务级别协议。StarTree在不重复的情况下以高并发服务Iceberg数据的能力是一个及时的进步。"
Soman表示,使用Iceberg而不是Pinot的专有原生格式会有轻微的性能权衡,但Pinot仍然能够以亚秒级延迟处理每秒数百个查询。
Meley表示,支持Iceberg的决定既反映了市场动力也反映了客户的实际需求。他说:"我们所有的客户都在询问Iceberg。它正在成为湖仓存储的标准,这使我们能够原生支持它,同时简化服务数据产品的架构。"
好文章,需要你的鼓励
法国人工智能公司Mistral AI宣布完成17亿欧元(约20亿美元)C轮融资,由荷兰半导体设备制造商ASML领投。此轮融资使Mistral估值从去年的60亿美元翻倍至137亿美元。英伟达、DST Global等知名投资机构参投。作为欧洲领先的AI开发商,Mistral凭借先进的多语言大模型与OpenAI等美国公司竞争,其聊天机器人Le Chat具备语音模式等功能。
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
VAST Data收购了成立仅数月的初创公司Red Stapler,该公司由NetApp资深团队创立。Red Stapler创始人兼CEO Jonsi Stefansson将担任VAST云解决方案总经理,负责超大规模云战略。Red Stapler拥有6名开发人员,开发了跨SaaS交付、API集成、监控等功能的云控制平面和服务交付平台,将加速VAST AI OS在超大规模和多云环境中的部署,深化与全球领先超大规模云服务商的合作关系。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。