在芝加哥举行的Next会议前,Nutanix概述了Nutanix云平台(NCP)的全面扩展计划,该公司称这标志着"真正的AI时代"到来。
最新更新涵盖AI基础设施、Kubernetes、服务提供商工具和生态系统合作伙伴关系,但都围绕一个核心目标:帮助企业和新兴新云提供商管理日益不可预测的AI工作负载。
AI工作负载暴露新问题
产品和解决方案营销高级副总裁Lee Caswell指出了AI环境中日益严重的问题:不可预测的资源消耗。
"我们听到的最大痛点是关于不可预测的Token生成和消耗,"他在最近的新闻发布会上表示。"Token现在是GPU消耗的新指标。"
AI推理和智能体驱动的系统产生高度可变的需求,Token使用量和GPU利用率会以不可预测的模式激增。这使容量规划和成本控制变得复杂。
HyperFrame Research首席执行官兼分析师Steven Dickens表示:"AI基础设施市场已经从'GPU稀缺'时期转向'运营成熟'时期。"
"赢家通吃"的新云市场
Nutanix战略的核心要素是进军GPU云提供商市场。这些新云运营商将共享AI基础设施作为可货币化服务提供,Dickens说这个新兴市场已经开始整合。
"我们看到'赢家通吃'的动态,可能只有五到七家提供商将控制大部分非超大规模AI计算,"他说。"大多数新云提供商无法在转型中幸存。"
他指出,资本密集度、获得下一代芯片的机会和专业软件堆栈是驱动因素。CoreWeave等公司通过将GPU视为金融资产而非基础设施,建立了早期领先优势。
Token经济学:从基础设施到收益
向基于Token的消费转变是Nutanix定位和更广泛市场的核心。
"基于Token的消费是单位经济学的根本转变,"Dickens说。"基础设施首次有了'收益率'。在传统云中,你为'房间'付费——虚拟机或容器。在Token经济中,你为'餐食'付费——输出。"
运营商越来越关注吞吐量——每单位时间和成本能生成多少Token——而不仅仅是正常运行时间。据Dickens称,这迫使硬件和推理引擎之间更紧密的集成。
存储、网络或编排中的低效率现在直接降低GPU输出。因此,Nutanix将存储定位为"AI工厂"的性能层,吞吐量决定了模型训练和服务的效率。
编排和主权
随着基础设施变得更加抽象,控制权正在向上转移。
"真正的控制点正在编排和治理层出现,"Dickens说。
虽然超大规模云服务商主导物理基础设施,但企业忠诚度越来越与数据和AI智能体的管理相关。对于Dickens来说,"锁定"发生在企业数据与模型相遇的点。这推动了对"主权AI"环境的需求——允许企业在不中断数据管道或违反法规的情况下在模型之间切换的平台。
在这种环境中,Dickens看到了Nutanix的明确机会。该公司不是在超大规模上竞争,而是针对需要更严格控制数据、成本和部署的企业。SP Central等新功能旨在将共享GPU集群转变为受治理的、可货币化的服务层。
从云优先到"AI智能"
如果Nutanix能够集成本地环境和新云容量,它可能在企业AI采用的关键控制点定位自己。但这取决于执行能力——以及企业是否优先考虑控制权而非访问超大规模基础设施。
该公司将灵活性定位为对硬件约束的对冲,强调更广泛的基础设施支持和现有投资的重用。随着AI进入生产阶段,挑战不仅是访问计算资源,还要控制如何消耗、衡量和货币化这些资源。
"我们看到从AI优先到AI智能的类似转变,"Caswell说。
这种转变可能会降低通用云模型的利润率,并加速无法针对Token级效率进行优化的提供商之间的整合。
Q&A
Q1:Nutanix云平台如何解决AI工作负载的不可预测性问题?
A:Nutanix通过扩展云平台功能来管理不可预测的Token生成和消耗。新更新包括裸机Kubernetes、多租户AI基础设施的服务提供商工具,以及跨存储、数据服务和云环境的深度集成,帮助企业更好地进行容量规划和成本控制。
Q2:什么是Token经济学,它如何改变AI基础设施市场?
A:Token经济学是基于Token消耗的新计费模式,代表了单位经济学的根本转变。传统云计算按虚拟机或容器等"房间"付费,而Token经济按实际输出的"餐食"付费。这使基础设施首次具有了"收益率"概念,运营商更关注每单位时间和成本能生成多少Token。
Q3:新云市场的"赢家通吃"趋势对行业有什么影响?
A:分析师预测只有五到七家新云提供商能控制大部分非超大规模AI计算市场,大多数提供商无法在转型中生存。这是由资本密集度、获得下一代芯片机会和专业软件堆栈等因素驱动的。成功的公司如CoreWeave将GPU视为金融资产而非基础设施,建立了早期优势。
好文章,需要你的鼓励
牛津大学提出PHYSIFORMER,一种扩散变换器模型,通过三维网格顶点轨迹直接在世界坐标空间预测刚性与弹性物体的物理运动,一次性生成全序列轨迹,超越自回归基线。
随着医疗数据数字化与互操作性的进步,跨机构纵向患者数据的研究应用成为可能。本研究通过对20位领域专家的访谈,识别出8种数据收集方法,涵盖智能手机应用、结构化数据导出、区域/全国研究查询及聚合数据源等。研究发现,各方法均有其优缺点,无单一最优方案。参与者中介交换方式可绕过复杂治理安排,但存在数据缺口;全国性网络尚不支持研究查询。公共政策的持续推进将对该领域发展起关键作用。
研究发现主流奖励模型对同等质量答案给出差异悬殊的分数,并提出"奖励聚类"算法通过蒙特卡洛随机失活将连续分数离散化,在不重训模型的前提下有效减少AI训练中的奖励作弊现象。