分布式计算初创公司Taho Inc.野心勃勃,在今天获得350万美元种子轮融资后,计划取代Kubernetes成为人工智能工作负载核心的主要编排和调度层。
这轮融资由"战略天使投资者和行业内部人士"领投,不过这家由Meta Platforms Inc.、Google LLC和Snap Inc.基础设施资深人士创建的公司并未提及具体投资者姓名。该公司重点介绍了在AI性能方面的具体改进,称其计算框架可以将工作负载处理时间提升100%,同时将成本降至通常水平的一小部分。
Taho表示已开发出高性能联邦计算框架,通过将图形处理单元等AI硬件的有效输出提升一倍来改善工作负载效率。该平台通过用更快、更简单、更低成本的方式部署任何计算环境中的工作负载,来替代臃肿的基础设施软件和复杂的运行时环境。
该公司将矛头指向Kubernetes这一流行的开源软件,它被用来编排托管现代应用程序组件的容器。Kubernetes凭借其灵活性、扩展能力和广泛的自动化功能,已成为AI应用的关键。它能够在分布式环境中为AI应用实现更高效的资源分配,同时加速部署时间。
然而,Taho联合创始人兼首席执行官Todd Smith表示,Kubernetes实际上并非为大规模运行的现代AI工作负载需求而设计,因此有很大的改进空间。他说这家初创公司并非要完全取代Kubernetes,而是只替换其编排和调度功能。Smith解释说,Taho运行在应用层之下,可以直接插入Kubernetes集群、容器以及他们已在使用的持续开发/持续集成流水线中。
Taho将分布式云和边缘基础设施转换为紧密交织的结构,就像一台智能超级计算机,动态共享资源并实现完美协调。这家初创公司表示,它专为高吞吐量、始终在线的工作负载而构建,如AI训练和推理作业、大语言模型和仿真流水线。
这些工作负载本质上被分解为离散任务,可以分布到组织的可用计算资源上,无论这些资源位于何处,然后实时重新组装。其计算结果在全局持久化,消除了冗余工作。
"我们所做的是为你放在Taho上的工作负载替换传统的集中式编排层,"Smith说道。"Taho不是由单一控制平面调度整个容器,而是作为联邦运行时,将工作以细粒度任务的形式分布到你的整个设备群中,包括云、本地和边缘。在许多部署中,Kubernetes成为管道和打包工具,而Taho成为提供巨大性能和成本收益的主要执行结构。"
这些性能提升和成本降低可能非常显著,一些计算作业完成速度可提升10倍,某些工作负载的成本可降低90%。更重要的是,团队无需投入太多工作就能实现这些收益,因为Taho与现有软件框架和持续集成/持续部署工作流程兼容。
Smith表示,该公司的目标是引入基础设施计算的新范式,以支持由AI和其他高性能工作负载需求驱动的"抛物线需求增长"。"我们都看到AI工作负载在爆炸式增长,但基础设施建设无法跟上步伐,"他说。"我们创立Taho是因为世界需要更好的计算方式——一种足够简单、快速和经济实惠的方式,让每家AI驱动的公司都能盈利增长。"
Taho表示,此轮融资将用于在关键领域招聘新员工,并在明年平台更广泛推出之前扩展早期客户部署。
Q&A
Q1:Taho是什么?它与Kubernetes有什么区别?
A:Taho是一个高性能联邦计算框架,专门为AI工作负载设计。它不是完全替代Kubernetes,而是替换Kubernetes的编排和调度功能,运行在应用层之下,可以直接插入现有的Kubernetes集群中。
Q2:Taho能带来多大的性能提升?
A:Taho可以将AI工作负载处理时间提升100%,某些计算作业完成速度可提升10倍,同时将成本降低到原来的十分之一,在某些工作负载中成本可降低90%。
Q3:使用Taho需要改变现有的技术架构吗?
A:不需要大幅改变。Taho与现有软件框架和持续集成/持续部署工作流程兼容,可以直接插入Kubernetes集群、容器以及现有的CI/CD流水线中,团队无需投入太多工作就能实现性能提升。
好文章,需要你的鼓励
软银集团已完成对OpenAI的400亿美元投资,向其转账225亿美元。此次投资使软银获得约11%的OpenAI股份,成为仅次于微软的第二大投资者。OpenAI将利用这些资金推进Starlink数据中心项目,计划到2029年在美国部署100亿瓦的计算能力。为完成此次投资,软银出售了部分投资组合资产,包括英伟达和T-Mobile股票,并以ARM股份作抵押获得贷款。
MBZUAI和法国综合理工学院联合开发的SchED算法能让AI写作速度提升3-4倍。该算法通过监测AI生成文本的置信度,采用进度感知的动态阈值策略,在保持99.8%-100%原始质量的同时显著减少计算时间。实验覆盖多种任务类型,证明了算法的有效性和鲁棒性。
TrendForce将2026年笔记本市场预测下调至1.73亿台,同比下降5.4%。报告指出,若内存短缺未改善,下滑幅度可能达10.1%。尽管面临挑战,苹果预计将在2026年春季推出低成本MacBook,并凭借供应链效率和规模优势减少影响。IDC警告称,由于AI数据中心需求激增导致内存芯片严重短缺,PC出货量可能下滑9%,平均售价将上涨4-8%。
西安交通大学研究团队发现,AI视觉语言模型容易受到功能词(如"是"、"的"等)的干扰而遭受攻击。他们开发了功能词去注意力(FDA)机制,让AI减少对这些词汇的关注。测试显示,该方法可将攻击成功率降低18%-90%,而正常性能仅下降0.2%-0.6%。FDA无需额外训练即可集成到现有模型中,为AI安全防护提供了简单有效的解决方案。